OpenSage: 자체 프로그래밍 에이전트 생성 엔진
OpenSage: Self-programming Agent Generation Engine
에이전트 개발 키트(ADK)는 에이전트 구축을 위한 효과적인 플랫폼과 도구를 제공하며, 특히 에이전트의 성능은 에이전트 구조, 도구 및 메모리 기능 설계에 크게 좌우됩니다. 그러나 현재 ADK는 충분한 기능 지원이 부족하거나 이러한 구성 요소를 수동으로 설계하도록 요구하여, 에이전트의 일반화 능력과 전체 성능을 제한합니다. 본 논문에서는 OpenSage를 제안합니다. OpenSage는 LLM이 자체적으로 에이전트의 구조와 도구 세트를 생성하도록 지원하는 최초의 ADK이며, 포괄적이고 체계적인 메모리 지원 기능을 제공합니다. OpenSage는 에이전트가 자체 하위 에이전트와 도구 키트를 생성하고 관리할 수 있는 효과적인 기능을 제공합니다. 또한 효율적인 관리를 위한 계층적 그래프 기반 메모리 시스템과 소프트웨어 엔지니어링 작업을 위한 특수 도구 키트를 특징으로 합니다. 최첨단 벤치마크 세 가지에서 다양한 기반 모델을 사용한 광범위한 실험을 통해 OpenSage가 기존 ADK보다 우수한 성능을 보임을 입증했습니다. 또한 각 구성 요소의 효과성을 입증하기 위한 엄격한 분석 연구를 수행했습니다. 우리는 OpenSage가 차세대 에이전트 개발의 길을 열어, 인간 중심에서 AI 중심의 패러다임으로 전환하는 데 기여할 수 있을 것이라고 믿습니다.
Agent development kits (ADKs) provide effective platforms and tooling for constructing agents, and their designs are critical to the constructed agents' performance, especially the functionality for agent topology, tools, and memory. However, current ADKs either lack sufficient functional support or rely on humans to manually design these components, limiting agents' generalizability and overall performance. We propose OpenSage, the first ADK that enables LLMs to automatically create agents with self-generated topology and toolsets while providing comprehensive and structured memory support. OpenSage offers effective functionality for agents to create and manage their own sub-agents and toolkits. It also features a hierarchical, graph-based memory system for efficient management and a specialized toolkit tailored to software engineering tasks. Extensive experiments across three state-of-the-art benchmarks with various backbone models demonstrate the advantages of OpenSage over existing ADKs. We also conduct rigorous ablation studies to demonstrate the effectiveness of our design for each component. We believe OpenSage can pave the way for the next generation of agent development, shifting the focus from human-centered to AI-centered paradigms.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.