수렴 보장이 있는 증명된 효율적 오프-정책 적대 모방 학습 | Synapse