Key points are not available for this paper at this time.
최근 음성 변환 분야에서 높은 품질의 성과를 가져오는 중요한 발전이 있었습니다. 그러나 여전히 이 분야에는 두 가지 중요한 도전 과제가 존재합니다. 첫째, 현재의 음성 변환 방법은 보지 못한 화자를 만나면 강인성이 제한적입니다. 둘째, 음색 표현을 제어하는 능력도 제한적입니다. 이러한 문제를 해결하기 위해 본 논문에서는 보지 못한 화자를 다룰 때 강인성을 향상시키기 위해 다층 잔여 근사치를 활용하는 새로운 접근 방식을 제안합니다. 이 방식은 잔여 화자 모듈이라고 하며, 다층 근사치를 도입함으로써 음색에서 정보를 분리하고 음성 변환에서 음색을 효과적으로 제어할 수 있게 합니다. 제안된 방법은 주관적 및 객관적 평가에서 기준보다 뛰어난 성능을 보여주며, 우수한 성과와 향상된 강인성을 입증합니다. 우리의 데모 페이지는 공개적으로 제공됩니다.
Xu 외 (Sun,)은 이 질문을 연구했습니다.