가치 함수 기반 강화 학습을 위한 행동 전이 | Synapse