La alucinación en Modelos de Lenguaje Grandes (LLMs) se refiere a salidas que parecen fluidas y coherentes pero son fácticamente incorrectas, lógicamente inconsistentes o completamente fabricadas. A medida que los LLMs se implementan cada vez más en educación, atención médica, derecho e investigación científica, entender y mitigar las alucinaciones se ha vuelto crítico. En este trabajo, presentamos una encuesta comprensiva y un análisis empírico de la atribución de alucinaciones en LLMs. Introducimos un marco novedoso para determinar si una alucinación dada proviene de una entrada no optimizada o del comportamiento intrínseco del modelo. Evaluamos LLMs de última generación—incluyendo GPT-4, LLaMA 2, DeepSeek, entre otros—bajo diversas condiciones de entrada controladas, utilizando benchmarks establecidos (TruthfulQA, HallucinationEval) para juzgar la factualidad. Nuestro marco de atribución define métricas para Sensibilidad a la Entrada (PS) y Variabilidad del Modelo (MV), que juntas cuantifican la contribución de las entradas frente a factores internos del modelo a las alucinaciones. A través de experimentos extensivos y análisis comparativos, identificamos patrones distintos en la ocurrencia, gravedad y mitigación de alucinaciones entre modelos. Notablemente, estrategias de entrada estructuradas como la entrada de cadena de pensamiento (CoT) reducen significativamente las alucinaciones en escenarios sensibles a la entrada, aunque las limitaciones intrínsecas del modelo persisten en algunos casos. Estos hallazgos contribuyen a una comprensión más profunda de la fiabilidad de los LLM y proporcionan ideas para ingenieros de entrada, desarrolladores de modelos y practicantes de IA. Además, proponemos mejores prácticas y direcciones futuras para reducir las alucinaciones tanto en el diseño de entradas como en las tuberías de desarrollo del modelo.
Anh-Hoang et al. (Tue,) estudiaron esta cuestión.