December 1, 1985

Reconocimiento de vocales en un solo fotograma utilizando cuantificación vectorial con varias medidas de distancia

Puntos clave

Los puntos clave no están disponibles para este artículo en este momento.

Resumen

Uno de los conceptos más fundamentales utilizados en el modelo estándar de reconocimiento de patrones para el reconocimiento de voz es el de la distancia entre pares de fotogramas de habla. Se han propuesto y estudiado varias medidas de distancia en el contexto de un reconocedor de voz en general. El propósito de esta investigación fue aislar los efectos de diferentes medidas de distancia en un reconocedor de los otros tipos de procesamiento típicamente utilizados en el reconocimiento. La forma en que se logró este aislamiento fue utilizar un reconocedor basado en puntuaciones de distancia de un solo fotograma, utilizando un enfoque de cuantificación vectorial para proporcionar los patrones de referencia de un solo fotograma requeridos por el reconocedor. El vocabulario para el reconocimiento fue el conjunto de vocales continuas extraídas de palabras portadoras. Se realizó un experimento de reconocimiento de vocales dependiente del hablante utilizando siete hablantes (cuatro hombres, tres mujeres) y cinco medidas de distancia. Los resultados indicaron que hubo diferencias en el rendimiento para las diferentes medidas de distancia cuando el número de patrones de libro de códigos por vocal era uno o dos; sin embargo, cuando el número de patrones de libro de códigos era cuatro o más, estas diferencias en el rendimiento se volvieron insignificantes.

Preguntar a la IA

Me gusta

Guardar