Los puntos clave no están disponibles para este artículo en este momento.
Investigaciones recientes exploran la optimización utilizando modelos de lenguaje grandes (LLMs) ya sea buscando iterativamente soluciones para el siguiente paso de los LLMs o solicitando directamente a los LLMs un optimizador. Sin embargo, estos enfoques presentan limitaciones inherentes, incluyendo baja eficiencia operativa, alta sensibilidad al diseño de prompts y falta de conocimiento específico de dominio. Introducimos LLaMoCo, el primer marco de ajuste de instrucciones diseñado para adaptar los LLMs para resolver problemas de optimización de manera de código a código. Específicamente, establecemos un conjunto de instrucciones completo que contiene prompts de problemas bien descritos y códigos de optimización efectivos. Luego, desarrollamos una nueva estrategia de aprendizaje en dos fases que incorpora un procedimiento de calentamiento basado en aprendizaje contrastivo antes de la fase de ajuste de instrucciones para mejorar el comportamiento de convergencia durante el ajuste fino del modelo. Los resultados de los experimentos demuestran que un modelo CodeGen (350M) ajustado finamente por nuestro LLaMoCo logra un rendimiento de optimización superior en comparación con GPT-4 Turbo y otros competidores tanto en conjuntos de problemas sintéticos como realistas. El modelo ajustado finamente y las instrucciones de uso están disponibles en https://anonymous.4open.science/r/LLaMoCo-722A.
Ma et al. (Sat,) estudiaron esta cuestión.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: