2601.19793v1 Jan 27, 2026 cs.AI

CASTER: 작업 효율적 라우팅을 위한 문맥 인식 전략을 통해 다중 에이전트 오케스트레이션의 비용-성능 장벽 허물기

CASTER: Breaking the Cost-Performance Barrier in Multi-Agent Orchestration via Context-Aware Strategy for Task Efficient Routing

Shanyv Liu
Shanyv Liu
Citations: 0
h-index: 0
Xuyang Yuan
Xuyang Yuan
Citations: 0
h-index: 0
Zijun Zhan
Zijun Zhan
Citations: 56
h-index: 4
Zhu Han
Zhu Han
Citations: 8
h-index: 1
Danyang Zheng
Danyang Zheng
Citations: 11
h-index: 1
Weishan Zhang
Weishan Zhang
Citations: 30
h-index: 4
Shaohua Cao
Shaohua Cao
Citations: 35
h-index: 4
Tao Chen
Tao Chen
Citations: 2,333
h-index: 9

그래프 기반 다중 에이전트 시스템(MAS)은 복잡한 순환 워크플로를 가능하게 하지만, 사소한 하위 작업에도 고성능 모델을 일률적으로 배치하여 연산 자원을 낭비하는 비효율적인 정적 모델 할당 문제를 겪고 있습니다. 본 논문에서는 그래프 기반 MAS에서 동적 모델 선택을 위한 경량 라우터인 CASTER(Context-Aware Strategy for Task Efficient Routing)를 제안합니다. CASTER는 의미론적 임베딩과 구조적 메타 특징을 결합하여 작업 난이도를 추정하는 이중 신호 라우터(Dual-Signal Router)를 사용합니다. 훈련 과정에서 라우터는 '콜드 스타트에서 반복적 진화(Cold Start to Iterative Evolution)' 패러다임을 통해 자체 최적화하며, 온폴리시(on-policy) 부정적 피드백을 통해 자신의 라우팅 실패로부터 학습합니다. 소프트웨어 공학, 데이터 분석, 과학적 발견 및 사이버 보안 전반에 걸친 LLM-as-a-Judge 평가 실험에서, CASTER는 고성능 모델 베이스라인과 유사한 성공률을 유지하면서 추론 비용을 최대 72.4% 절감했으며, 모든 도메인에서 휴리스틱 라우팅 및 FrugalGPT보다 일관되게 우수한 성능을 입증했습니다.

Original Abstract

Graph-based Multi-Agent Systems (MAS) enable complex cyclic workflows but suffer from inefficient static model allocation, where deploying strong models uniformly wastes computation on trivial sub-tasks. We propose CASTER (Context-Aware Strategy for Task Efficient Routing), a lightweight router for dynamic model selection in graph-based MAS. CASTER employs a Dual-Signal Router that combines semantic embeddings with structural meta-features to estimate task difficulty. During training, the router self-optimizes through a Cold Start to Iterative Evolution paradigm, learning from its own routing failures via on-policy negative feedback. Experiments using LLM-as-a-Judge evaluation across Software Engineering, Data Analysis, Scientific Discovery, and Cybersecurity demonstrate that CASTER reduces inference cost by up to 72.4% compared to strong-model baselines while matching their success rates, and consistently outperforms both heuristic routing and FrugalGPT across all domains.

0 Citations
0 Influential
4.5 Altmetric
22.5 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!