AOrchestra: 에이전트 오케스트레이션을 위한 하위 에이전트 생성 자동화
AOrchestra: Automating Sub-Agent Creation for Agentic Orchestration
언어 에이전트는 작업 자동화에 있어 강력한 가능성을 보여주었습니다. 점점 더 복잡하고 장기적인 작업에서 이러한 가능성을 실현하기 위해, 멀티 턴 작업 해결을 위한 '도구로서의 하위 에이전트(sub-agent-as-tools)' 패러다임이 부상했습니다. 그러나 기존 설계들은 하위 에이전트에 대한 동적 추상화 관점이 부족하여 적응성을 저해하고 있습니다. 우리는 모든 에이전트를 (지시, 맥락, 도구, 모델)의 튜플로 모델링하는, 통합되고 프레임워크에 구애받지 않는 에이전트 추상화를 통해 이 문제를 해결합니다. 이 튜플은 역량 구성을 위한 레시피 역할을 하며, 시스템이 각 작업에 대해 전문화된 실행기를 필요에 따라 생성할 수 있게 합니다. 이러한 추상화를 바탕으로 우리는 에이전트 시스템 AOrchestra를 소개합니다. 이 시스템에서는 중앙 오케스트레이터가 각 단계에서 튜플을 구체화합니다. 즉, 작업 관련 맥락을 선별하고, 도구와 모델을 선택하며, 즉석 자동 에이전트 생성을 통해 실행을 위임합니다. 이러한 설계는 인간의 엔지니어링 노력을 줄여주며, 다양한 에이전트를 작업 실행기로 지원하는 플러그 앤 플레이 방식을 통해 프레임워크 독립성을 유지합니다. 또한 제어 가능한 성능-비용 트레이드오프를 가능하게 하여 시스템이 파레토 효율성에 근접하도록 합니다. 세 가지 난이도 높은 벤치마크(GAIA, SWE-Bench, Terminal-Bench)에서 AOrchestra는 Gemini-3-Flash와 결합했을 때 가장 강력한 베이스라인 대비 16.28%의 상대적 성능 향상을 달성했습니다. 코드는 https://github.com/FoundationAgents/AOrchestra 에서 이용 가능합니다.
Language agents have shown strong promise for task automation. Realizing this promise for increasingly complex, long-horizon tasks has driven the rise of a sub-agent-as-tools paradigm for multi-turn task solving. However, existing designs still lack a dynamic abstraction view of sub-agents, thereby hurting adaptability. We address this challenge with a unified, framework-agnostic agent abstraction that models any agent as a tuple Instruction, Context, Tools, Model. This tuple acts as a compositional recipe for capabilities, enabling the system to spawn specialized executors for each task on demand. Building on this abstraction, we introduce an agentic system AOrchestra, where the central orchestrator concretizes the tuple at each step: it curates task-relevant context, selects tools and models, and delegates execution via on-the-fly automatic agent creation. Such designs enable reducing human engineering efforts, and remain framework-agnostic with plug-and-play support for diverse agents as task executors. It also enables a controllable performance-cost trade-off, allowing the system to approach Pareto-efficient. Across three challenging benchmarks (GAIA, SWE-Bench, Terminal-Bench), AOrchestra achieves 16.28% relative improvement against the strongest baseline when paired with Gemini-3-Flash. The code is available at: https://github.com/FoundationAgents/AOrchestra
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.