설명 기반 캡션 개선을 통한 캡션 충실도 향상 및 비전-언어 미세 조정 | Synapse