多智能体系统(MAS)已成为一种强大的范式,用于协调大型语言模型(LLMs)和专业工具,以协作解决复杂任务。然而,现有的MAS框架通常需要手动配置工作流,缺乏对动态演进和性能优化的原生支持。此外,许多MAS优化算法并未整合到统一的框架中。在本文中,我们提出了EvoAgentX,一个开源平台,自动生成、执行和演化优化多智能体工作流。EvoAgentX采用由五个核心层组成的模块化架构:基本组件、智能体、工作流、演进和评估层。具体而言,在演进层内,EvoAgentX整合了三种MAS优化算法,TextGrad、AFlow和MIPRO,以迭代方式优化智能体提示、工具配置和工作流拓扑。我们在HotPotQA、MBPP和MATH上评估EvoAgentX,分别用于多步推理、代码生成和数学问题求解,并进一步使用GAIA评估其在现实任务中的表现。实验结果表明,EvoAgentX始终实现显著的性能提升,包括HotPotQA F1提高7.44%、MBPP pass@1提高10.00%、MATH求解准确率提高10.00%,以及GAIA整体准确率提高高达20.00%。源代码可在:https://github.com/EvoAgentX/EvoAgentX
王等人(周五)研究了这个问题。