본 연구에서는 고고도 플랫폼(High-Altitude Platform: HAP)을 활용한 이동 기지국 배치 문제를 사용자 밀집도 변화 예측과 강화학습을 결합하여 최적화하는 방안을 제안한다. 베이징 지역의 Geolife GPS Trajectories 데이터를 전처리하여 건물 밀집도에 따른 3개 지역을 설정하고, GRU 모델을 통해 10분 단위 사용자 밀집도를 예측하였다. 예측된 밀집도 정보를 바탕으로 Deep Q-Network (DQN)을 활용하여 이동 기지국의 최적 배치 정책을 학습하였으며, 기지국 1개 및 2개 배치 시나리오에 대해 성능을 비교 분석하였다. 실험 결과, 제안한 방법은 모든 시나리오에서 주요 밀집 구역을 효과적으로 커버하며, 기지국 수와 학습 전략 조절을 통해 건물 밀집도가 높은 시나리오에서 기존의 실시간 greedy 방식 대비 성능을 향상시킬 수 있음을 확인하였다.
Shin et al. (Thu,) studied this question.