희소한 보상을 넘어: 조합적 상태 복원을 통한 자기지도 구조 강화학습 | Synapse