2605.05007v1 May 06, 2026 cs.AI

유노-오케스트라: 선택적 위임을 통한 간결한 에이전트 라우팅

Uno-Orchestra: Parsimonious Agent Routing via Selective Delegation

Yuxin Wu
Yuxin Wu
Citations: 1,975
h-index: 9
Yifu Guo
Yifu Guo
Citations: 74
h-index: 3
Siru Zhong
Siru Zhong
Citations: 354
h-index: 9
Zhiqing Cui
Zhiqing Cui
Citations: 67
h-index: 4
Hanqing Wang
Hanqing Wang
Citations: 43
h-index: 3
Cheng Yang
Cheng Yang
Tencent
Citations: 101
h-index: 6
Siyu Zhang
Siyu Zhang
Citations: 8
h-index: 2
Xin Yu
Xin Yu
Citations: 17
h-index: 3
Haotong Xie
Haotong Xie
Citations: 332
h-index: 2
Jiahao Yuan
Jiahao Yuan
Citations: 13
h-index: 1
Yifan Wu
Yifan Wu
Citations: 38
h-index: 1
Tao Yu
Tao Yu
Citations: 196
h-index: 1
Qibing Ren
Qibing Ren
Citations: 207
h-index: 3
Usman Naseem
Usman Naseem
Citations: 92
h-index: 6

대규모 언어 모델(LLM) 기반 멀티 에이전트 시스템은 일반적으로 경직된 오케스트레이션을 사용하며, 이는 각 쿼리에 대한 평탄한 라우팅 또는 수동으로 설계된 작업 분해 중 하나에 의존합니다. 따라서 분해 깊이, 작업자 선택, 추론 예산이 단일 목표 하에 공동으로 최적화되지 않습니다. 본 논문에서는 Uno-Orchestra라는 통합 오케스트레이션 정책을 소개합니다. Uno-Orchestra는 작업을 선택적으로 분해하고 각 하위 작업을 허용 가능한 (모델, 기본 기능) 쌍으로 배분합니다. 이러한 결정은 실제 작업자 상호 작용을 기반으로 생성된 강화 학습(RL) 경로로부터 함께 학습됩니다. 수학, 코드, 지식, 긴 컨텍스트, 에이전트 도구 사용을 포괄하는 13개의 벤치마크 스위트에서 22개의 기준 모델과 비교한 결과, Uno-Orchestra는 77.0%의 높은 정확도를 달성했으며, 이는 가장 강력한 워크플로우 기준 모델보다 약 16% 높은 수치입니다. 또한 Uno-Orchestra는 쿼리당 비용이 약 10배 낮아 선택적 위임의 정확도-효율성 경계를 향상시킵니다.

Original Abstract

Large language model (LLM) multi-agent systems typically rely on rigid orchestration, committing either to flat per-query routing or to hand-engineered task decomposition, so decomposition depth, worker choice, and inference budget are not jointly optimized under one objective. We introduce Uno-Orchestra, a unified orchestration policy that selectively decomposes a task and dispatches each subtask to an admissible (model, primitive) pair, with both decisions learned together from curated RL trajectories grounded in real worker interactions. Against 22 baselines on a 13-benchmark suite spanning math, code, knowledge, long-context, and agentic tool-use, Uno-Orchestra reaches 77.0% macro pass@1, roughly 16% above the strongest workflow baseline, at roughly an order of magnitude lower per-query cost, advancing the accuracy-efficiency frontier of selective delegation.

0 Citations
0 Influential
4.5 Altmetric
22.5 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!