June 10, 2024Open Access

7000以上の言語におけるメタラーニングテキスト音声合成

Key Points

Key points are not available for this paper at this time.

Abstract

本研究では、7000以上の言語で音声を生成できる単一のテキスト音声合成システムを構築するという困難な課題に取り組みます。これらの多くは、従来のTTS開発に必要なデータが不足しています。大規模な多言語の事前学習とメタラーニングを統合して言語表現を近似する新しいアプローチにより、データがない言語でもゼロショット音声合成が可能になります。多様な言語環境にわたる客観的な尺度と人間の評価を通じて、システムの性能を検証します。コードとモデルを公開することで、限られた言語資源を持つコミュニティを支援し、音声技術の分野でのさらなる革新を促進することを目指します。

Read Full Paperexternally

AIに質問

Bookmark

View Full Paper