Key points are not available for this paper at this time.
최근 몇 년 동안, 심층 강화 학습은 점진적으로 실제 세계의 작업에 적용되고 있습니다. 특히 제어 분야에서 강화 학습은 로봇 제어, 자율 주행 등과 같은 전례 없는 인기를 보여주었습니다. 다른 알고리즘은 서로 다른 문제에 적합할 수 있으므로, 우리는 행동 공간의 관점에서 기존의 고급 심층 강화 학습 알고리즘을 조사하고 분석합니다. 동시에 이산 행동 공간, 연속 행동 공간, 이산-연속 혼합 행동 공간 간의 차이점과 연관성을 분석하고, 다양한 행동 공간에 적합한 여러 강화 학습 알고리즘을 상세히 설명합니다. 실제 세계의 제어 문제에 강화 학습을 적용하는 것은 여전히 엄청난 도전을 제공합니다. 마지막으로, 우리는 이러한 도전을 요약하고 강화 학습이 위성 자세 제어 작업에 적절하게 적용될 수 있는 방법에 대해 논의합니다.
Zhu et al. (수요일) 는 이 질문을 연구했습니다.