September 28, 2025Open Access

Fortalecendo a Compreensão da Programação em Grandes Modelos de Linguagem por meio da Geração de Código

Key Points

Grandes modelos de linguagem melhoraram seu desempenho em tarefas de código com o método proposto, aprimorando a compreensão de conceitos de programação.
A avaliação em vários benchmarks mostrou melhorias significativas na compreensão dos princípios de fluxo de dados e fluxo de controle.
Essa abordagem combina aumento de código contrafactual e ajuste consciente de conceito para abordar questões de compreensão nos LLMs.
Os resultados podem permitir uma adoção mais ampla dos LLMs no desenvolvimento de software, superando suas limitações em raciocínio.

Abstract

Grandes modelos de linguagem (LLMs) mostraram recentemente resultados impressionantes em diversas tarefas relacionadas a código, beneficiando-se de treinamento em larga escala e ajuste de instruções. No entanto, estudos revelam que sua compreensão de conceitos fundamentais de programação, como fluxo de dados e fluxo de controle, permanece superficial, levando a um desempenho frágil quando o código exige um raciocínio mais profundo. Essa limitação restringe a adoção prática dos LLMs no desenvolvimento de software do mundo real. Para abordar essa questão, este trabalho introduz uma estrutura de aumento de código contrafactual combinada com ajuste consciente de conceito, projetada para guiar os LLMs em direção a uma compreensão conceitual mais forte. Uma avaliação abrangente em vários modelos e benchmarks demonstra a eficácia da abordagem proposta.

Read Full Paperexternally

Perguntar à IA

Bookmark

View Full Paper