AgentFactory: 실행 가능한 하위 에이전트의 축적 및 재사용을 통한 자가 진화 프레임워크
AgentFactory: A Self-Evolving Framework Through Executable Subagent Accumulation and Reuse
LLM 기반 에이전트 구축은 점점 더 중요해지고 있습니다. 최근 LLM 기반 에이전트의 자가 진화 연구는 주로 성공적인 경험을 텍스트 프롬프트나 성찰로 기록하지만, 이는 복잡한 시나리오에서 효율적인 작업 재실행을 확실하게 보장하지 못합니다. 본 연구에서는 성공적인 작업 해결 방안을 텍스트 경험 대신 실행 가능한 하위 에이전트 코드 형태로 보존하는 새로운 자가 진화 패러다임인 AgentFactory를 제안합니다. 특히, 이러한 하위 에이전트는 실행 피드백을 기반으로 지속적으로 개선되어, 더 많은 작업이 수행될수록 더욱 강력하고 효율적으로 발전합니다. 저장된 하위 에이전트는 표준화된 문서와 함께 순수 Python 코드로 제공되어, 모든 Python 환경에서 사용 가능합니다. AgentFactory는 지속적인 기능 축적을 가능하게 합니다. 즉, 실행 가능한 하위 에이전트 라이브러리는 시간이 지남에 따라 성장하고 개선되며, 수동 개입 없이 유사한 작업에 필요한 노력을 점진적으로 줄여줍니다. 저희 구현체는 https://github.com/zzatpku/AgentFactory 에서 오픈 소스로 제공되며, 데모 영상은 https://youtu.be/iKSsuAXJHW0 에서 확인할 수 있습니다.
Building LLM-based agents has become increasingly important. Recent works on LLM-based agent self-evolution primarily record successful experiences as textual prompts or reflections, which cannot reliably guarantee efficient task re-execution in complex scenarios. We propose AgentFactory, a new self-evolution paradigm that preserves successful task solutions as executable subagent code rather than textual experience. Crucially, these subagents are continuously refined based on execution feedback, becoming increasingly robust and efficient as more tasks are encountered. Saved subagents are pure Python code with standardized documentation, enabling portability across any Python-capable system. We demonstrate that AgentFactory enables continuous capability accumulation: its library of executable subagents grows and improves over time, progressively reducing the effort required for similar tasks without manual intervention. Our implementation is open-sourced at https://github.com/zzatpku/AgentFactory, and our demonstration video is available at https://youtu.be/iKSsuAXJHW0.
AI Analysis
Korean Summary
Key Innovations
- 경험의 실행 가능한 코드화: 에이전트의 성공적인 경험을 텍스트(프롬프트, 자연어 반성 등)가 아닌 실행 가능한 파이썬 스크립트 형태로 저장하여 복잡한 환경에서의 작업 재현성과 신뢰성 보장
- 3단계 자가 진화 라이프사이클: 새로운 스킬을 구축하는 Install, 피드백을 통해 코드를 수정하고 개선하는 Self-Evolve, 성숙한 스킬을 추출하는 Deploy의 체계적인 파이프라인 도입
- 피드백 기반 자율 코드 수정: 기존 서브에이전트가 새로운 변형 작업에 실패할 경우, 오케스트레이터(Meta-Agent)가 실행 피드백을 분석하고 직접 코드를 수정하여 예외 처리 및 범용성을 강화
- 높은 이식성과 상호운용성: 저장된 서브에이전트는 순수 파이썬 코드와 표준화된 설명서(SKILL.md)로 구성되어 LangChain, AutoGen, Claude Code 등 다른 외부 프레임워크에서 즉시 재사용 가능
Learning & Inference Impact
학습(Skill Accumulation) 측면에서는 모델의 파라미터를 업데이트하는 대신, 에이전트가 런타임 환경에서 성공적인 문제 해결 패턴을 파이썬 코드로 작성하고 피드백을 통해 이를 스스로 디버깅·확장함으로써 영구적이고 실질적인 스킬 라이브러리를 구축(학습)합니다. 이는 기존의 텍스트 기반 자가 반성 모델보다 훨씬 견고한 지식 축적 방식을 제공합니다. 추론(Inference) 측면에서는 직면한 과제를 처음부터 계획하고 해결하는 대신 기존에 생성·검증된 서브에이전트를 툴(Tool)로 직접 호출하여 재사용합니다. 이를 통해 메타 에이전트의 오케스트레이션에 필요한 LLM 호출 횟수와 토큰 소비량을 획기적으로 줄여주며, 결과적으로 추론 속도 향상, 비용 절감, 그리고 문제 해결의 안정성 극대화라는 긍정적인 영향을 미칩니다.
Technical Difficulty
Estimated implementation complexity based on methodology.