EvoAgent: 기술 학습 및 다중 에이전트 위임을 통한 진화형 에이전트 프레임워크
EvoAgent: An Evolvable Agent Framework with Skill Learning and Multi-Agent Delegation
본 논문에서는 구조화된 기술 학습과 계층적 하위 에이전트 위임 메커니즘을 통합한 진화형 대규모 언어 모델(LLM) 에이전트 프레임워크인 EvoAgent를 제안합니다. EvoAgent는 기술을 트리거 메커니즘과 진화 메타데이터가 장착된 다중 파일 구조화된 기능 단위로 모델링하며, 사용자 피드백 기반의 폐루프 프로세스를 통해 지속적인 기술 생성 및 최적화를 가능하게 합니다. 또한, 세 단계의 기술 매칭 전략과 세 계층 메모리 아키텍처를 통합하여, 복잡한 문제에 대한 동적 작업 분해 및 장기적인 기능 축적을 지원합니다. 실제 해외 무역 시나리오를 기반으로 한 실험 결과는 EvoAgent를 통합함으로써 GPT5.2가 전문성, 정확성 및 실용적인 유용성 측면에서 상당한 개선을 이룬다는 것을 보여줍니다. 5차원 LLM-as-Judge 평가 프로토콜 하에서, 전체 평균 점수가 약 28% 증가했습니다. 추가적인 모델 전이 실험은 에이전트 시스템의 성능이 기본 모델의 고유한 능력뿐만 아니라, 모델과 에이전트 아키텍처 간의 시너지 정도에 따라 달라진다는 것을 나타냅니다.
This paper proposes EvoAgent - an evolvable large language model (LLM) agent framework that integrates structured skill learning with a hierarchical sub-agent delegation mechanism. EvoAgent models skills as multi-file structured capability units equipped with triggering mechanisms and evolutionary metadata, and enables continuous skill generation and optimization through a user-feedback-driven closed-loop process. In addition, by incorporating a three-stage skill matching strategy and a three-layer memory architecture, the framework supports dynamic task decomposition for complex problems and long-term capability accumulation. Experimental results based on real-world foreign trade scenarios demonstrate that, after integrating EvoAgent, GPT5.2 achieves significant improvements in professionalism, accuracy, and practical utility. Under a five-dimensional LLM-as-Judge evaluation protocol, the overall average score increases by approximately 28%. Further model transfer experiments indicate that the performance of an agent system depends not only on the intrinsic capabilities of the underlying model, but also on the degree of synergy between the model and the agent architecture.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.