Los puntos clave no están disponibles para este artículo en este momento.
Los agentes autónomos impulsados por modelos de lenguaje grandes (LLMs) muestran un potencial significativo para lograr una alta autonomía en varios escenarios, como el desarrollo de software. Investigaciones recientes han demostrado que los agentes LLM pueden aprovechar experiencias pasadas para reducir errores y mejorar la eficiencia. Sin embargo, el paradigma de experiencia estática, que depende de una colección fija de experiencias pasadas adquiridas heurísticamente, carece de refinamiento iterativo y, por lo tanto, restringe la adaptabilidad de los agentes. En este artículo, introducimos el marco de Refinamiento Iterativo de la Experiencia, que permite a los agentes LLM refinar experiencias de manera iterativa durante la ejecución de tareas. Proponemos dos patrones fundamentales: el patrón sucesivo, que se refina en función de las experiencias más cercanas dentro de un lote de tareas, y el patrón cumulativo, que adquiere experiencias a través de todos los lotes de tareas anteriores. Aumentado con nuestra eliminación heurística de experiencias, el método prioriza experiencias de alta calidad y utilizadas con frecuencia, gestionando eficazmente el espacio de experiencias y mejorando la eficiencia. Experimentos extensos muestran que, si bien el patrón sucesivo puede arrojar mejores resultados, el patrón cumulativo proporciona un rendimiento más estable. Además, la eliminación de experiencias facilita lograr un mejor rendimiento utilizando solo el 11.54% de un subconjunto de alta calidad.
Qian et al. (martes,) estudiaron esta cuestión.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: