Grandes modelos de linguagem (LLMs) mostraram recentemente resultados impressionantes em diversas tarefas relacionadas a código, beneficiando-se de treinamento em larga escala e ajuste de instruções. No entanto, estudos revelam que sua compreensão de conceitos fundamentais de programação, como fluxo de dados e fluxo de controle, permanece superficial, levando a um desempenho frágil quando o código exige um raciocínio mais profundo. Essa limitação restringe a adoção prática dos LLMs no desenvolvimento de software do mundo real. Para abordar essa questão, este trabalho introduz uma estrutura de aumento de código contrafactual combinada com ajuste consciente de conceito, projetada para guiar os LLMs em direção a uma compreensão conceitual mais forte. Uma avaliação abrangente em vários modelos e benchmarks demonstra a eficácia da abordagem proposta.
Ren et al. (Mon,) estudaram essa questão.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: