La tecnología de captación de voz propia para dispositivos auditivos facilita la comunicación en entornos ruidosos. Los sistemas de reconstrucción de voz propia (OVR) mejoran la calidad y la inteligibilidad de las señales de voz propia grabadas en ruido. Dado que las perturbaciones que afectan las señales de voz propia grabadas dependen de factores individuales, los sistemas OVR personalizados tienen el potencial de superar a los sistemas OVR genéricos. En este artículo, proponemos personalizar los sistemas OVR a través de la augmentación de datos y el ajuste fino, comparándolos con sus contrapartes genéricas. Investigamos la influencia de la personalización en la calidad del habla evaluada por métricas objetivas y realizamos una prueba de escucha subjetiva para evaluar la calidad en diversas condiciones. Además, evaluamos la precisión de predicción de las métricas objetivas comparando la calidad predicha con la calidad medida subjetivamente. Nuestros hallazgos sugieren que OVR personalizado proporciona beneficios sobre OVR genérico solo para algunos hablantes. Nuestros resultados también indican que las comparaciones de rendimiento entre sistemas no siempre son predichas con precisión por métricas objetivas. En particular, ciertas perturbaciones llevan a una sobreestimación consistente de la calidad en comparación con las valoraciones subjetivas reales.
Ohlenbusch et al. (Martes,) estudiaron esta cuestión.