Los Modelos de Lenguaje Grandes (LLMs) han surgido como un paradigma dominante en el procesamiento del lenguaje natural, demostrando un fuerte rendimiento en una amplia gama de tareas de generación y razonamiento. Estos sistemas dependen de pipelines de entrenamiento en múltiples etapas que integran pre-entrenamiento auto-supervisado a gran escala, ajuste fino supervisado y técnicas de alineación. Este documento presenta un estudio de mapeo sistemático de las metodologías de entrenamiento de LLM contemporáneas, enfatizando las arquitecturas basadas en transformadores, objetivos de optimización y estrategias de curación de datos, así como arquitecturas dispersas emergentes como los modelos Mixture-of-Experts (MoE). Analizamos enfoques de ajuste fino eficientes en parámetros, marcos de generación aumentados por recuperación y técnicas de entrenamiento multimodal, que organizamos en una taxonomía comparativa unificada. Discutimos desafíos técnicos clave como limitaciones de escalabilidad, alucinaciones, amplificación de sesgos y compensaciones de alineación-capacidad, y luego identificamos direcciones de investigación emergentes como el entrenamiento centrado en el razonamiento. Este trabajo proporciona una referencia técnica concisa para investigadores y practicantes que trabajan en el entrenamiento escalable y confiable de modelos de lenguaje.
Karydas et al. (Thu,) estudiaron esta cuestión.