Los puntos clave no están disponibles para este artículo en este momento.
Los avances recientes en modelos de lenguaje grande (LLMs) han avanzado en el desarrollo de la traducción de habla y máquina multilingüe mediante la reducción de errores de representación e incorporación de conocimiento externo. Sin embargo, ambas tareas de traducción normalmente utilizan la decodificación por búsqueda de haz y la selección de la hipótesis top-1 para la inferencia. Estas técnicas luchan por aprovechar plenamente la rica información en las diversas hipótesis N-best, lo que las hace menos óptimas para tareas de traducción que requieren una única secuencia de salida de alta calidad. En este documento, proponemos un nuevo paradigma generativo para tareas de traducción, a saber, "GenTranslate", que se basa en LLMs para generar mejores resultados a partir de las diversas versiones de traducción en la lista N-best. Aprovechando el rico conocimiento lingüístico y las fuertes habilidades de razonamiento de los LLMs, nuestro nuevo paradigma puede integrar la rica información en los candidatos N-best para generar un resultado de traducción de mayor calidad. Además, para apoyar el ajuste fino de LLM, construimos y lanzamos un conjunto de datos HypoTranslate que contiene más de 592,000 pares de hipótesis-traducción en 11 idiomas. Experimentos en varios puntos de referencia de traducción de habla y máquina (por ejemplo, FLEURS, CoVoST-2, WMT) demuestran que nuestro GenTranslate supera significativamente al modelo de última generación.
Hu et al. (Sat,) estudiaron esta cuestión.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: