유노-오케스트라: 선택적 위임을 통한 간결한 에이전트 라우팅
Uno-Orchestra: Parsimonious Agent Routing via Selective Delegation
대규모 언어 모델(LLM) 기반 멀티 에이전트 시스템은 일반적으로 경직된 오케스트레이션을 사용하며, 이는 각 쿼리에 대한 평탄한 라우팅 또는 수동으로 설계된 작업 분해 중 하나에 의존합니다. 따라서 분해 깊이, 작업자 선택, 추론 예산이 단일 목표 하에 공동으로 최적화되지 않습니다. 본 논문에서는 Uno-Orchestra라는 통합 오케스트레이션 정책을 소개합니다. Uno-Orchestra는 작업을 선택적으로 분해하고 각 하위 작업을 허용 가능한 (모델, 기본 기능) 쌍으로 배분합니다. 이러한 결정은 실제 작업자 상호 작용을 기반으로 생성된 강화 학습(RL) 경로로부터 함께 학습됩니다. 수학, 코드, 지식, 긴 컨텍스트, 에이전트 도구 사용을 포괄하는 13개의 벤치마크 스위트에서 22개의 기준 모델과 비교한 결과, Uno-Orchestra는 77.0%의 높은 정확도를 달성했으며, 이는 가장 강력한 워크플로우 기준 모델보다 약 16% 높은 수치입니다. 또한 Uno-Orchestra는 쿼리당 비용이 약 10배 낮아 선택적 위임의 정확도-효율성 경계를 향상시킵니다.
Large language model (LLM) multi-agent systems typically rely on rigid orchestration, committing either to flat per-query routing or to hand-engineered task decomposition, so decomposition depth, worker choice, and inference budget are not jointly optimized under one objective. We introduce Uno-Orchestra, a unified orchestration policy that selectively decomposes a task and dispatches each subtask to an admissible (model, primitive) pair, with both decisions learned together from curated RL trajectories grounded in real worker interactions. Against 22 baselines on a 13-benchmark suite spanning math, code, knowledge, long-context, and agentic tool-use, Uno-Orchestra reaches 77.0% macro pass@1, roughly 16% above the strongest workflow baseline, at roughly an order of magnitude lower per-query cost, advancing the accuracy-efficiency frontier of selective delegation.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.