다중 에이전트 추론 및 협업을 위한 약링크 최적화
Weak-Link Optimization for Multi-Agent Reasoning and Collaboration
LLM 기반 다중 에이전트 프레임워크는 다중 역할 협업을 통해 복잡한 추론 작업을 수행합니다. 그러나 기존 접근 방식은 종종 추론 불안정성을 겪으며, 이는 개별 에이전트의 오류가 협업을 통해 증폭되어 전체 성능을 저해하는 현상입니다. 현재 연구는 주로 프레임워크의 효과성을 높이기 위해 고성능 에이전트를 강화하거나 신뢰할 수 없는 출력을 억제하는 데 집중하는 반면, 성능 제한 요인인 에이전트를 체계적으로 식별하고 강화하는 데는 상대적으로 덜 주의를 기울입니다. 이러한 격차를 해소하기 위해, 우리는 약링크 원칙에 기반한 다중 에이전트 추론 및 협업을 위한 약링크 최적화 프레임워크인 WORC를 제안합니다. WORC는 두 단계의 워크플로우를 따릅니다. 첫째, 약한 에이전트 식별 단계에서는 작업 특징을 구성하고, 군집 지능 알고리즘(SIAs)에 의해 식별된 최적 구성에 대해 훈련된 메타 학습 기반 가중치 예측 모델을 사용하여 이러한 특징을 에이전트 성능 가중치로 매핑합니다. 예측 가중치가 가장 낮은 에이전트를 약한 에이전트로 식별합니다. 둘째, 약링크 최적화 단계에서는 불확실성에 기반한 할당 전략을 사용하여 약한 에이전트에 추가적인 추론 자원을 할당합니다. 예측 가중치가 낮을수록 신뢰성 부족을 보완하기 위해 반복 샘플링 쿼터가 더 크게 할당됩니다. 실험 결과는 WORC가 추론 벤치마크에서 평균 82.2%의 정확도를 달성했으며, 프레임워크 안정성과 다양한 아키텍처에서의 일반화 성능을 향상시켰음을 보여줍니다. 이는 강점을 강화하는 것뿐만 아니라 약한 링크를 보완하는 것이 다중 에이전트 시스템의 견고성을 향상시키는 데 효과적임을 시사합니다.
LLM-driven multi-agent frameworks address complex reasoning tasks through multi-role collaboration. However, existing approaches often suffer from reasoning instability, where individual agent errors are amplified through collaboration, undermining overall performance. Current research mainly focuses on enhancing high-capability agents or suppressing unreliable outputs to improve framework effectiveness, while systematic identification and reinforcement of performance-limiting agents receive less attention. To address this gap, we propose WORC, a \underline{w}eak-link \underline{o}ptimization framework for multi-agent \underline{r}easoning and \underline{c}ollaboration, grounded in the weak-link principle. WORC follows a two-stage workflow. In the weak agent localization stage, task features are constructed, and a meta-learning-based weight predictor trained on optimal configurations identified by swarm intelligence algorithms (SIAs) enables zero-shot mapping from these features to agent performance weights, where the agent with the lowest predicted weight is identified as the weak agent. In the weak-link optimization stage, an uncertainty-driven allocation strategy assigns additional reasoning budgets to weak agents, with lower predicted weights leading to larger repeated-sampling quotas to compensate for reliability deficiencies. Experimental results show that WORC achieves an average accuracy of 82.2\% on reasoning benchmarks while improving framework stability and cross-architecture generalization, suggesting that compensating for weak links, rather than reinforcing strengths alone, enhances the robustness of multi-agent systems.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.