2601.23219v1 Jan 30, 2026 cs.MA

MonoScale: 단조적 성능 향상을 통한 다중 에이전트 시스템 확장

MonoScale: Scaling Multi-Agent System with Monotonic Improvement

Shuai Shao
Shuai Shao
Citations: 60
h-index: 2
Yixiang Liu
Yixiang Liu
Citations: 142
h-index: 4
Bingwei Lu
Bingwei Lu
Citations: 1
h-index: 1
Weinan Zhang
Weinan Zhang
Citations: 21
h-index: 2

최근 몇 년 동안, LLM 기반 다중 에이전트 시스템(MAS)은 과제 분해 및 전문 에이전트에게 하위 과제 위임을 위해 라우터를 사용하는 방식으로 빠르게 발전해 왔습니다. 에이전트 풀의 기능을 확장하는 자연스러운 방법은 새로운 기능 에이전트 또는 도구 인터페이스를 지속적으로 통합하는 것이지만, 단순한 확장은 라우터가 새로 추가된 이질적이고 신뢰성이 낮은 에이전트에 대해 초기 시작될 때 성능 저하를 유발할 수 있습니다. 본 논문에서는 MonoScale이라는, 확장 상황을 고려한 업데이트 프레임워크를 제안합니다. MonoScale은 에이전트의 특성에 맞는 적응형 학습 과제를 생성하고, 성공 및 실패한 상호 작용으로부터 증거를 수집하며, 이를 감사 가능한 자연어 메모리로 변환하여 향후 라우팅을 안내합니다. 우리는 순차적 증강을 컨텍스트 밴딧 문제로 정의하고, 신뢰 영역 내 메모리 업데이트를 수행하여 온보딩 과정에서 성능이 단조적으로 증가하는 것을 보장합니다. GAIA와 Humanity's Last Exam 데이터셋에 대한 실험 결과, 에이전트 풀이 증가함에 따라 안정적인 성능 향상을 보였으며, 단순 확장 방식과 강력한 라우터를 사용하는 고정 에이전트 풀 방식의 기존 방법보다 우수한 성능을 나타냈습니다.

Original Abstract

In recent years, LLM-based multi-agent systems (MAS) have advanced rapidly, using a router to decompose tasks and delegate subtasks to specialized agents. A natural way to expand capability is to scale up the agent pool by continually integrating new functional agents or tool interfaces, but naive expansion can trigger performance collapse when the router cold-starts on newly added, heterogeneous, and unreliable agents. We propose MonoScale, an expansion-aware update framework that proactively generates a small set of agent-conditioned familiarization tasks, harvests evidence from both successful and failed interactions, and distills it into auditable natural-language memory to guide future routing. We formalize sequential augmentation as a contextual bandit and perform trust-region memory updates, yielding a monotonic non-decreasing performance guarantee across onboarding rounds. Experiments on GAIA and Humanity's Last Exam show stable gains as the agent pool grows, outperforming naive scale-up and strong-router fixed-pool baselines.

0 Citations
0 Influential
2 Altmetric
10.0 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!