March 18, 2024Open Access

Construir um Corpus de Mandarim Chinês com Mais de 50 Horas para Reconhecimento de Fala Infantil

Key Points

Key points are not available for this paper at this time.

Abstract

O reconhecimento de fala infantil desempenha um papel importante na pesquisa educacional de crianças. Os sistemas usuais de reconhecimento automático de fala (ASR) não são satisfatórios em termos de reconhecimento de fala para crianças, principalmente devido à falta de corpus de fala infantil. Nos últimos anos, houve um grande número de estudos relacionados ao reconhecimento de fala infantil, a maioria dos quais é aprimorada com base na pequena quantidade de dados existente através de aumento de dados, aprendizado por transferência, etc., cuja promoção é limitada. O propósito da nossa pesquisa é estabelecer um corpus de fala infantil para o reconhecimento de fala infantil. Primeiramente, utilizamos o sistema de avaliação de proficiência linguística infantil para coletar dados de fala infantil rotulados de forma fraca de crianças de 3 a 12 anos, e obtemos texto transcrito através de uma interface de reconhecimento de fala de nível comercial. Em seguida, este artigo propõe um método para verificar rapidamente o texto transcrito e seleciona pares de dados rotulados eficazes combinando características de pronúncia infantil e pinyin chinês, construindo um corpus de mais de 50 horas de fala infantil em mandarim. Experimentei o modelo pré-treinado de ponta a ponta de mandarim atualmente em destaque, ajustando os dados que construí, e consegui uma redução de 15% no CER com base na linha de base sem utilizar ajustes.

Construir um Corpus de Mandarim Chinês com Mais de 50 Horas para Reconhecimento de Fala Infantil

Key Points

Abstract

Cite This Study

Also Consider

Also Consider