연속 시간 무한 수평 최적 제어 문제를 해결하기 위한 온라인 정책 반복 기반 알고리즘 | Synapse