코드 없는 개발(No-Code Development, NCD)의 발전은 시민 개발자들이 전통적인 프로그래밍 전문 지식 없이 애플리케이션을 구축할 수 있게 하였습니다. 하지만 이러한 플랫폼이 복잡하고 상호 의존적인 작업을 처리하기 위해 확장됨에 따라 그 한계가 드러나고 있습니다. 대형 언어 모델(Large Language Models, LLMs)은 잠재적인 해결책을 제공하지만, 단일 에이전트 시스템은 완전한 스택 개발을 신뢰성 있게 관리하는 데 어려움을 겪는 경우가 많습니다. 본 연구는 YAML 기반 워크플로우를 통해 전문화된 LLM 에이전트를 조정하여 NCD 작업을 자동화하는 Open No-code 개발 프레임워크인 MASON이라는 다중 에이전트 시스템(Multi-Agent System, MAS)을 소개합니다. 본 시스템은 Claude 3.5 Sonnet, GPT-4o Mini, Gemini 1.5 Flash, DeepSeek-Chat 등 네 가지 독점 모델을 대상으로 HumanEval 및 MBPP 벤치마크를 사용하여 정확성, 실행 시간 및 안정성을 평가하였습니다. MASON 설정은 간단한 워크플로우에서 작업 신뢰성을 향상시켰지만, 더 복잡한 작업에서 지연을 초래했습니다. 소규모 로컬 호스팅 LLM을 사용한 추가 테스트는 자원이 제한된 환경에서의 상당한 한계를 드러내었으며, 자원 제약 환경에서의 배포를 지원하기 위해 구조적 재설계나 모델 미세 조정의 필요성을 강조했습니다.
Building similarity graph...
Analyzing shared references across papers
Loading...
Muhammed Roshan Palayamkot
Kayvan Karim
Proceedings of the AAAI Symposium Series
Building similarity graph...
Analyzing shared references across papers
Loading...
Palayamkot et al. (Fri,) 이 질문을 연구했습니다.
synapsesocial.com/papers/68c1a90554b1d3bfb60e1f03 — DOI: https://doi.org/10.1609/aaaiss.v6i1.36068
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: