인코더 수준 지식 증류를 통한 효율적인 오디오 캡셔닝 | Synapse