AOrchestra: 에이전트 기반 오케스트레이션을 위한 서브 에이전트 자동 생성
AOrchestra: Automating Sub-Agent Creation for Agentic Orchestration
언어 에이전트는 작업 자동화에 큰 잠재력을 보여왔습니다. 점점 더 복잡하고 장기적인 작업에서 이러한 잠재력을 실현하기 위해, 다중 단계 작업 해결을 위한 서브 에이전트-를-도구 패러다임이 등장했습니다. 그러나 기존 설계는 여전히 서브 에이전트에 대한 동적인 추상화 관점을 제공하지 못하여, 적응성을 저해합니다. 우리는 이러한 문제를 해결하기 위해, 모든 에이전트를 Instruction(명령), Context(문맥), Tools(도구), Model(모델)의 튜플로 모델링하는 통합적이고 프레임워크에 독립적인 에이전트 추상화를 제시합니다. 이 튜플은 기능의 조합 레시피 역할을 하며, 시스템이 각 작업에 필요한 경우 특화된 실행기를 자동으로 생성할 수 있도록 합니다. 이 추상화를 기반으로, 우리는 AOrchestra라는 에이전트 시스템을 소개합니다. AOrchestra의 중앙 오케스트레이터는 각 단계에서 이 튜플을 구체화합니다. 즉, 작업과 관련된 문맥을 선별하고, 도구와 모델을 선택하며, 실시간으로 에이전트를 자동으로 생성하여 실행을 위임합니다. 이러한 설계는 인간의 엔지니어링 노력을 줄이고, 다양한 에이전트를 작업 실행기로 사용하기 위한 플러그 앤 플레이 지원을 통해 프레임워크에 독립성을 유지합니다. 또한, 시스템은 성능과 비용 간의 균형을 조절할 수 있도록 하여, 파레토 효율에 가까워질 수 있습니다. GAIA, SWE-Bench, Terminal-Bench라는 세 가지 어려운 벤치마크에서, AOrchestra는 Gemini-3-Flash와 함께 사용할 때 가장 강력한 기준 모델보다 16.28%의 상대적인 성능 향상을 달성했습니다. 코드는 다음 링크에서 확인할 수 있습니다: https://github.com/FoundationAgents/AOrchestra
Language agents have shown strong promise for task automation. Realizing this promise for increasingly complex, long-horizon tasks has driven the rise of a sub-agent-as-tools paradigm for multi-turn task solving. However, existing designs still lack a dynamic abstraction view of sub-agents, thereby hurting adaptability. We address this challenge with a unified, framework-agnostic agent abstraction that models any agent as a tuple Instruction, Context, Tools, Model. This tuple acts as a compositional recipe for capabilities, enabling the system to spawn specialized executors for each task on demand. Building on this abstraction, we introduce an agentic system AOrchestra, where the central orchestrator concretizes the tuple at each step: it curates task-relevant context, selects tools and models, and delegates execution via on-the-fly automatic agent creation. Such designs enable reducing human engineering efforts, and remain framework-agnostic with plug-and-play support for diverse agents as task executors. It also enables a controllable performance-cost trade-off, allowing the system to approach Pareto-efficient. Across three challenging benchmarks (GAIA, SWE-Bench, Terminal-Bench), AOrchestra achieves 16.28% relative improvement against the strongest baseline when paired with Gemini-3-Flash. The code is available at: https://github.com/FoundationAgents/AOrchestra
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.