What type of study is this?

This is a Quantitative Study study (also classified as: Experimental Study).

October 2, 2025Open Access

Pesquisa e análise de alucinações em modelos de linguagem grandes: atribuição às estratégias de solicitação ou comportamento do modelo

Key Points

Alucinações em modelos de linguagem grandes podem ser influenciadas tanto por estratégias de solicitação quanto pelo comportamento intrínseco do modelo, levando a saídas variadas.
O estudo avalia vários modelos de ponta, como GPT-4 e LLaMA 2, utilizando benchmarks para avaliação de factualidade.
Os autores introduzem uma estrutura que quantifica o papel da Sensibilidade à Solicitação e da Variabilidade do Modelo nas atribuições de alucinação.
Os achados destacam estratégias de solicitação eficazes, como a solicitação de cadeia de pensamento, na redução de alucinações, ao mesmo tempo em que observam limitações do modelo.

Abstract

A alucinação em Modelos de Linguagem Grandes (LLMs) refere-se a saídas que parecem fluentes e coerentes, mas são factualmente incorretas, logicamente inconsistentes ou totalmente fabricadas. À medida que os LLMs são cada vez mais utilizados na educação, saúde, direito e pesquisa científica, entender e mitigar alucinações tornou-se crítico. Neste trabalho, apresentamos uma pesquisa abrangente e uma análise empírica da atribuição de alucinações em LLMs. Introduzindo uma nova estrutura para determinar se uma dada alucinação deriva de não otimização da solicitação ou do comportamento intrínseco do modelo. Avaliamos LLMs de ponta, incluindo GPT-4, LLaMA 2, DeepSeek e outros, sob várias condições controladas de solicitação, usando benchmarks estabelecidos (TruthfulQA, HallucinationEval) para julgar a factualidade. Nossa estrutura de atribuição define métricas para Sensibilidade à Solicitação (PS) e Variabilidade do Modelo (MV), que juntas quantificam a contribuição de solicitações versus fatores internos do modelo para alucinações. Através de extensos experimentos e análises comparativas, identificamos padrões distintos na ocorrência, gravidade e mitigação de alucinações entre os modelos. Notavelmente, estratégias de solicitação estruturadas, como solicitações de cadeia de pensamento (CoT), reduzem significativamente as alucinações em cenários sensíveis à solicitação, embora limitações intrínsecas do modelo persistam em alguns casos. Esses achados contribuem para uma compreensão mais profunda da confiabilidade dos LLMs e fornecem insights para engenheiros de solicitação, desenvolvedores de modelos e praticantes de IA. Além disso, propomos melhores práticas e direções futuras para reduzir alucinações tanto no design de solicitações quanto nos fluxos de desenvolvimento de modelos.

Read Full Paperexternally

Bookmark

View Full Paper

Cite This Study

Anh-Hoang et al. (Terça-feira,) estudaram esta questão.

synapsesocial.com/papers/68de84b65b556a9128e1b460 https://doi.org/https://doi.org/10.3389/frai.2025.1622292

Also Consider

Synapse has enriched 4 closely related papers on similar clinical questions. Consider them for comparative context:

Bookmark

View Full Paper