부정적인 예제를 포함한 다목적 최적화 대조 학습을 통한 사고 연쇄 추론 향상 | Synapse