What type of study is this?

This is a Quantitative Study study (also classified as: Experimental Study).

October 2, 2025Open Access

Encuesta y análisis de alucinaciones en modelos de lenguaje grandes: atribución a estrategias de entrada o comportamiento del modelo

Puntos clave

Las alucinaciones en modelos de lenguaje grandes pueden estar influenciadas tanto por estrategias de entrada como por el comportamiento intrínseco del modelo, lo que conduce a salidas variables.
El estudio evalúa varios modelos de última generación como GPT-4 y LLaMA 2 utilizando benchmarks para la evaluación de factualidad.
Los autores introducen un marco que cuantifica el papel de la Sensibilidad a la Entrada y la Variabilidad del Modelo en las atribuciones de alucinaciones.
Los hallazgos destacan estrategias de entrada efectivas como la entrada de cadena de pensamiento en la reducción de alucinaciones, aunque también se señalan limitaciones del modelo.

Resumen

La alucinación en Modelos de Lenguaje Grandes (LLMs) se refiere a salidas que parecen fluidas y coherentes pero son fácticamente incorrectas, lógicamente inconsistentes o completamente fabricadas. A medida que los LLMs se implementan cada vez más en educación, atención médica, derecho e investigación científica, entender y mitigar las alucinaciones se ha vuelto crítico. En este trabajo, presentamos una encuesta comprensiva y un análisis empírico de la atribución de alucinaciones en LLMs. Introducimos un marco novedoso para determinar si una alucinación dada proviene de una entrada no optimizada o del comportamiento intrínseco del modelo. Evaluamos LLMs de última generación—incluyendo GPT-4, LLaMA 2, DeepSeek, entre otros—bajo diversas condiciones de entrada controladas, utilizando benchmarks establecidos (TruthfulQA, HallucinationEval) para juzgar la factualidad. Nuestro marco de atribución define métricas para Sensibilidad a la Entrada (PS) y Variabilidad del Modelo (MV), que juntas cuantifican la contribución de las entradas frente a factores internos del modelo a las alucinaciones. A través de experimentos extensivos y análisis comparativos, identificamos patrones distintos en la ocurrencia, gravedad y mitigación de alucinaciones entre modelos. Notablemente, estrategias de entrada estructuradas como la entrada de cadena de pensamiento (CoT) reducen significativamente las alucinaciones en escenarios sensibles a la entrada, aunque las limitaciones intrínsecas del modelo persisten en algunos casos. Estos hallazgos contribuyen a una comprensión más profunda de la fiabilidad de los LLM y proporcionan ideas para ingenieros de entrada, desarrolladores de modelos y practicantes de IA. Además, proponemos mejores prácticas y direcciones futuras para reducir las alucinaciones tanto en el diseño de entradas como en las tuberías de desarrollo del modelo.

Leer artículo completoexternamente

Me gusta

Guardar

Ver artículo completo