September 1, 2024

일회성 음성 변환을 위한 잔여 화자 표현

Key Points

Key points are not available for this paper at this time.

Abstract

최근 음성 변환 분야에서 높은 품질의 성과를 가져오는 중요한 발전이 있었습니다. 그러나 여전히 이 분야에는 두 가지 중요한 도전 과제가 존재합니다. 첫째, 현재의 음성 변환 방법은 보지 못한 화자를 만나면 강인성이 제한적입니다. 둘째, 음색 표현을 제어하는 능력도 제한적입니다. 이러한 문제를 해결하기 위해 본 논문에서는 보지 못한 화자를 다룰 때 강인성을 향상시키기 위해 다층 잔여 근사치를 활용하는 새로운 접근 방식을 제안합니다. 이 방식은 잔여 화자 모듈이라고 하며, 다층 근사치를 도입함으로써 음색에서 정보를 분리하고 음성 변환에서 음색을 효과적으로 제어할 수 있게 합니다. 제안된 방법은 주관적 및 객관적 평가에서 기준보다 뛰어난 성능을 보여주며, 우수한 성과와 향상된 강인성을 입증합니다. 우리의 데모 페이지는 공개적으로 제공됩니다.

일회성 음성 변환을 위한 잔여 화자 표현

Key Points

Abstract

Cite This Study