물 분배 시스템(WDS)의 효율적이고 복원력 있는 제어는 점점 더 불확실한 수요 조건 하에서 지속 가능한 인프라 관리를 위해 중요합니다. 본 연구는 다일 계획 기간에 걸친 물탱크 스케줄링을 위해 세 가지 강화학습 알고리즘인 Proximal Policy Optimization (PPO), Deep Q-Network (DQN), Asynchronous Advantage Actor-Critic (A3C)의 종합적 벤치마킹 및 민감도 분석을 제시합니다. 시뮬레이션 기반 프레임워크는 현실적인 수요 변동성, 극한 운영 시나리오, LSTM 네트워크를 이용한 시간적 모델링을 통합하여 견고한 에이전트 학습을 가능하게 합니다. 광범위한 평가 결과, PPO는 최대 40% 적은 펌프 작동 횟수와 25% 적은 안전 위반으로 DQN보다 장기간 시나리오에서 우수한 성능을 보이며, 단기 시나리오에서도 경쟁력 있는 성능을 유지합니다. 상세 민감도 분석은 학습률이 가장 중요한 하이퍼파라미터임을 확인하였으며, DQN은 좁은 최적 범위(1×10^-3)를 보이나 PPO는 보다 넓은 견고성 범위(1×10^-5~3×10^-4)를 나타냅니다. 제거 실험(ablation study)은 LSTM 네트워크가 시간적 모델링을 향상시키는 반면, 단순한 DQN-FFN 구조가 LSTM이 보강된 구조보다 누적 보상 면에서 현저히 우수함을 보여줍니다(−93.85 대 −134.15, PPO-LSTM 기준). ±50 단위까지의 극한 수요 잡음 하에서도 PPO는 12% 성능 저하에 불과한 뛰어난 복원력을 보였으며 DQN은 28% 성능 저하를 나타냈습니다. 본 연구는 알고리즘 선택, 하이퍼파라미터 조정, 행동 공간 설계에 대한 실용적 지침을 제공하며, 복잡한 WDS에서 투명한 AI 구동 제어의 기반을 확립하고 산업 4.0/5.0 인프라 현대화에 직접적인 영향을 미칩니다.
Building similarity graph...
Analyzing shared references across papers
Loading...
Hee-Beom Park
Kumoh National Institute of Technology
Akeem Bayo Kareem
Yusuf Olatunji Kareem
University of Ilorin
Complex & Intelligent Systems
Kumoh National Institute of Technology
University of Ilorin
Building similarity graph...
Analyzing shared references across papers
Loading...
박 등(Wed,)이 이 질문을 연구함.
synapsesocial.com/papers/69d896046c1944d70ce0728f — DOI: https://doi.org/10.1007/s40747-026-02244-0
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: