Key points are not available for this paper at this time.
Este artigo se concentrará em nossos esforços recentes para melhorar ainda mais a qualidade acústica do mecanismo de Texto para Fala Whistler. Desenvolvemos um sistema de suavização avançado que um pequeno estudo piloto indica que melhora significativamente a qualidade. Representamos a fala como sendo composta por uma série de quadros, onde cada quadro pode ser sintetizado a partir de um vetor de parâmetros. Cada quadro é representado por um estado em um HMM, onde a distribuição de saída de cada estado é um vetor aleatório gaussiano consistindo em x e Dx. O conjunto de vetores que maximiza a probabilidade do HMM é a representação da saída de fala suavizada. Esta técnica segue nosso objetivo tradicional de desenvolver métodos cujos parâmetros são aprendidos automaticamente a partir de dados com intervenção humana mínima. A estrutura geral é demonstrada como robusta ao manter uma qualidade melhorada com uma redução significativa nos dados. 1. INTRODUÇÃO Em contraste com a maioria dos sistemas de Texto para Fala (TTS) (incluindo tanto formante quanto concatenativo...
Plumpe et al. (Mon,) estudaram essa questão.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: