지능의 조율: 다중 규모 모델 전반의 효율적 다중 에이전트 협업을 위한 신뢰도 인식 라우팅
Orchestrating Intelligence: Confidence-Aware Routing for Efficient Multi-Agent Collaboration across Multi-Scale Models
다중 에이전트 시스템(MAS)은 복잡한 추론 작업에서 단일 에이전트 접근 방식보다 우수한 성능을 입증했지만, 종종 상당한 계산 비효율성을 겪습니다. 기존 프레임워크는 일반적으로 모든 에이전트 역할에 대규모 언어 모델(LLM)을 일률적으로 배치함으로써, 추론 단계마다 상이한 인지적 요구 사항을 고려하지 못하고 있습니다. 본 논문에서는 다양한 규모의 LLM으로 구성된 이종 풀(heterogeneous pool)에서 적응형 모델 선택 정책을 구현하는 새로운 다중 에이전트 프레임워크인 OI-MAS를 제안하여 이러한 비효율성을 해결합니다. 구체적으로, OI-MAS는 추론 과정 전반에 걸쳐 에이전트 역할과 모델 규모를 동적으로 선택하는 상태 의존적 라우팅 메커니즘을 도입합니다. 또한, 작업 복잡도에 따라 적절한 모델 규모를 선택하는 신뢰도 인식 메커니즘을 도입하여 대규모 모델에 대한 불필요한 의존을 줄입니다. 실험 결과, OI-MAS는 기준 다중 에이전트 시스템보다 일관되게 우수한 성능을 보였으며, 비용을 최대 79.78% 절감하는 동시에 정확도를 최대 12.88% 향상시켰습니다.
While multi-agent systems (MAS) have demonstrated superior performance over single-agent approaches in complex reasoning tasks, they often suffer from significant computational inefficiencies. Existing frameworks typically deploy large language models (LLMs) uniformly across all agent roles, failing to account for the varying cognitive demands of different reasoning stages. We address this inefficiency by proposing OI-MAS framework, a novel multi-agent framework that implements an adaptive model-selection policy across a heterogeneous pool of multi-scale LLMs. Specifically, OI-MAS introduces a state-dependent routing mechanism that dynamically selects agent roles and model scales throughout the reasoning process. In addition, we introduce a confidence-aware mechanism that selects appropriate model scales conditioned on task complexity, thus reducing unnecessary reliance on large-scale models. Experimental results show that OI-MAS consistently outperforms baseline multi-agent systems, improving accuracy by up to 12.88\% while reducing cost by up to 79.78\%.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.