What type of study is this?

September 10, 2025Open Access

Aprimoramento do reconhecimento automático da fala por meio de redes neurais profundas

Key Points

O sistema proposto melhora significativamente as habilidades de reconhecimento nas tarefas de reconhecimento automático da fala utilizando técnicas inovadoras.
As técnicas de aumento de dados, particularmente a perturbação de características, aprimoram os conjuntos de dados de treinamento para melhores previsões.
A integração das probabilidades posteriores de vários modelos de rede neural profunda aumenta a precisão no reconhecimento de fala.
O estudo demonstra meios eficazes de aprimorar o desempenho do classificador através de metodologias avançadas de aprendizado profundo.

Abstract

O desempenho das tarefas de reconhecimento de fala utilizando sistemas baseados em aprendizado profundo melhorou drasticamente nos últimos anos, ao empregar diferentes designs profundos e metodologias de aprendizado. Uma maneira popular de aumentar o número de dados de treinamento é chamada de Aumento de Dados (DA), e pesquisas mostram que o uso de DA é eficaz em ensinar modelos de redes neurais a fazer previsões invariantes. Além disso, as abordagens EM despertaram a atenção dos pesquisadores em aprendizado de máquina como um meio de melhorar o desempenho do classificador. Neste estudo, foi apresentada uma rede neural profunda única para reconhecimento de fala que utiliza tanto abordagens EM quanto DA para melhorar a precisão das previsões do sistema. Primeiro, é revelada uma abordagem baseada na perturbação do comprimento do trato vocal que já existe e, em seguida, propomos uma perturbação de características como uma abordagem alternativa de Aumento de Dados. Isso é seguido pela integração das probabilidades posteriores obtidas a partir de vários modelos acústicos de DNN treinados em diversos conjuntos de dados. Os resultados do estudo revelam que as habilidades de reconhecimento do sistema proposto melhoraram.

Aprimoramento do reconhecimento automático da fala por meio de redes neurais profundas

Key Points

Abstract

Cite This Study