StackPlanner: 태스크-경험 메모리 관리를 통한 중앙 집중식 계층적 멀티 에이전트 시스템
StackPlanner: A Centralized Hierarchical Multi-Agent System with Task-Experience Memory Management
대규모 언어 모델 기반의 멀티 에이전트 시스템, 특히 중앙 집중식 아키텍처는 최근 복잡하고 지식 집약적인 태스크에서 강력한 잠재력을 보여주었습니다. 그러나 중앙 에이전트는 메모리 관리의 부재로 인해 불안정한 장기 협업(long-horizon collaboration) 문제를 겪는 경우가 많으며, 이는 컨텍스트 팽창, 오류 누적, 저조한 교차 태스크 일반화 성능으로 이어집니다. 태스크 수준의 메모리 비효율성과 조정(coordination) 경험을 재사용하지 못하는 문제를 해결하기 위해, 본 논문에서는 명시적인 메모리 제어 기능을 갖춘 계층적 멀티 에이전트 프레임워크인 StackPlanner를 제안합니다. StackPlanner는 능동적인 태스크 수준 메모리 제어를 통해 상위 수준의 조정과 하위 태스크 실행을 분리하고, 구조화된 경험 메모리와 강화 학습을 통해 재사용 가능한 조정 경험을 검색하고 활용하는 법을 학습함으로써 이러한 문제를 해결합니다. 여러 심층 탐색(deep-search) 및 에이전트 시스템 벤치마크에 대한 실험을 통해, 신뢰할 수 있는 장기 멀티 에이전트 협업을 가능하게 하는 본 접근 방식의 효과를 입증했습니다.
Multi-agent systems based on large language models, particularly centralized architectures, have recently shown strong potential for complex and knowledge-intensive tasks. However, central agents often suffer from unstable long-horizon collaboration due to the lack of memory management, leading to context bloat, error accumulation, and poor cross-task generalization. To address both task-level memory inefficiency and the inability to reuse coordination experience, we propose StackPlanner, a hierarchical multi-agent framework with explicit memory control. StackPlanner addresses these challenges by decoupling high-level coordination from subtask execution with active task-level memory control, and by learning to retrieve and exploit reusable coordination experience via structured experience memory and reinforcement learning. Experiments on multiple deep-search and agent system benchmarks demonstrate the effectiveness of our approach in enabling reliable long-horizon multi-agent collaboration.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.