CASTER: 작업 효율적 라우팅을 위한 문맥 인식 전략을 통해 다중 에이전트 오케스트레이션의 비용-성능 장벽 허물기
CASTER: Breaking the Cost-Performance Barrier in Multi-Agent Orchestration via Context-Aware Strategy for Task Efficient Routing
그래프 기반 다중 에이전트 시스템(MAS)은 복잡한 순환 워크플로를 가능하게 하지만, 사소한 하위 작업에도 고성능 모델을 일률적으로 배치하여 연산 자원을 낭비하는 비효율적인 정적 모델 할당 문제를 겪고 있습니다. 본 논문에서는 그래프 기반 MAS에서 동적 모델 선택을 위한 경량 라우터인 CASTER(Context-Aware Strategy for Task Efficient Routing)를 제안합니다. CASTER는 의미론적 임베딩과 구조적 메타 특징을 결합하여 작업 난이도를 추정하는 이중 신호 라우터(Dual-Signal Router)를 사용합니다. 훈련 과정에서 라우터는 '콜드 스타트에서 반복적 진화(Cold Start to Iterative Evolution)' 패러다임을 통해 자체 최적화하며, 온폴리시(on-policy) 부정적 피드백을 통해 자신의 라우팅 실패로부터 학습합니다. 소프트웨어 공학, 데이터 분석, 과학적 발견 및 사이버 보안 전반에 걸친 LLM-as-a-Judge 평가 실험에서, CASTER는 고성능 모델 베이스라인과 유사한 성공률을 유지하면서 추론 비용을 최대 72.4% 절감했으며, 모든 도메인에서 휴리스틱 라우팅 및 FrugalGPT보다 일관되게 우수한 성능을 입증했습니다.
Graph-based Multi-Agent Systems (MAS) enable complex cyclic workflows but suffer from inefficient static model allocation, where deploying strong models uniformly wastes computation on trivial sub-tasks. We propose CASTER (Context-Aware Strategy for Task Efficient Routing), a lightweight router for dynamic model selection in graph-based MAS. CASTER employs a Dual-Signal Router that combines semantic embeddings with structural meta-features to estimate task difficulty. During training, the router self-optimizes through a Cold Start to Iterative Evolution paradigm, learning from its own routing failures via on-policy negative feedback. Experiments using LLM-as-a-Judge evaluation across Software Engineering, Data Analysis, Scientific Discovery, and Cybersecurity demonstrate that CASTER reduces inference cost by up to 72.4% compared to strong-model baselines while matching their success rates, and consistently outperforms both heuristic routing and FrugalGPT across all domains.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.