TCAndon-Router: 다중 에이전트 협업을 위한 적응형 추론 라우터
TCAndon-Router: Adaptive Reasoning Router for Multi-Agent Collaboration
다중 에이전트 시스템(MAS)은 고성능 지능형 애플리케이션을 구축하기 위한 강력한 패러다임이 되었습니다. 이러한 시스템 내에서 주어진 쿼리를 처리할 전문가 에이전트를 결정하는 라우터는 전체 성능에 있어 중요한 역할을 합니다. 기존의 라우팅 전략은 일반적으로 두 가지 범주로 나뉩니다. 서로 다른 크기의 모델 간에 지연 시간과 비용의 균형을 맞추는 '성능 라우팅'과, 정확도를 높이기 위해 도메인별 전문가에게 쿼리를 할당하는 '작업 라우팅'입니다. 실제 기업 애플리케이션에서는 작업 라우팅이 더 적합하지만, 대부분의 기존 접근 방식은 정적 단일 레이블 결정에 의존하여 두 가지 주요 한계를 지닙니다. 첫째, 비즈니스 도메인이 확장됨에 따라 새로운 에이전트를 유연하게 통합하기 어렵고, 둘째, 에이전트 역량의 중복으로 인한 라우팅 충돌이 발생하여 결과적으로 정확도와 견고성이 저하됩니다. 이러한 문제를 해결하기 위해, 우리는 다중 에이전트 협업을 위한 적응형 추론 라우터인 TCAndon-Router(TCAR)를 제안합니다. 기존 라우터와 달리 TCAR는 동적 에이전트 온보딩을 지원하며, 쿼리를 처리할 수 있는 후보 에이전트 집합을 예측하기 전에 먼저 자연어 추론 체인을 생성합니다. 또한, 선택된 에이전트들이 독립적으로 응답을 생성한 후, 전용 정제 에이전트(Refining Agent)가 이를 취합하고 다듬어 하나의 고품질 응답으로 만드는 협업 실행 파이프라인을 설계했습니다. 공개 데이터셋과 실제 기업 데이터에 대한 실험 결과, TCAR는 라우팅 정확도를 크게 향상시키고 라우팅 충돌을 줄이며 모호한 시나리오에서도 견고함을 유지하는 것으로 나타났습니다. 설명 가능하고 협업적인 다중 에이전트 라우팅에 대한 향후 연구를 지원하기 위해 https://huggingface.co/tencent/TCAndon-Router 에 TCAR를 공개했습니다.
Multi-Agent Systems(MAS) have become a powerful paradigm for building high performance intelligent applications. Within these systems, the router responsible for determining which expert agents should handle a given query plays a crucial role in overall performance. Existing routing strategies generally fall into two categories: performance routing, which balances latency and cost across models of different sizes, and task routing, which assigns queries to domain-specific experts to improve accuracy. In real-world enterprise applications, task routing is more suitable; however, most existing approaches rely on static single-label decisions, which introduce two major limitations: (i) difficulty in seamlessly integrating new agents as business domains expand, and (ii) routing conflicts caused by overlapping agent capabilities, ultimately degrading accuracy and robustness.To address these challenges, we propose TCAndon-Router(TCAR): an adaptive reasoning router for multi-agent collaboration. Unlike traditional routers, TCAR supports dynamic agent onboarding and first generates a natural-language reasoning chain before predicting a set of candidate agents capable of handling the query. In addition, we design a collaborative execution pipeline in which selected agents independently produce responses, which are then aggregated and refined into a single high-quality response by a dedicated Refining Agent.Experiments on public datasets and real enterprise data demonstrate that TCAR significantly improves routing accuracy, reduces routing conflicts, and remains robust in ambiguous scenarios. We have released TCAR at https://huggingface.co/tencent/TCAndon-Router to support future research on explainable and collaborative multi-agent routing.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.