에이전트 프림티브: 다중 에이전트 시스템을 위한 재사용 가능한 잠재적 구성 요소
Agent Primitives: Reusable Latent Building Blocks for Multi-Agent Systems
기존의 다중 에이전트 시스템(MAS)은 여러 에이전트 간의 협력을 통해 복잡한 문제를 해결할 수 있지만, 종종 특정 작업에 특화되어 있으며, 수동으로 설계된 에이전트 역할 및 상호 작용 프롬프트에 의존하여 아키텍처의 복잡성을 증가시키고 작업 간의 재사용성을 제한합니다. 또한, 대부분의 MAS는 주로 자연어 통신을 사용하므로, 내부 에이전트 기록 내의 긴 문맥 및 다단계 상호 작용에서 오류 누적 및 불안정성이 발생하기 쉽습니다. 본 연구에서는 LLM 기반 MAS를 위한 재사용 가능한 잠재적 구성 요소인 **에이전트 프림티브(Agent Primitives)**를 제안합니다. 신경망 설계에서 복잡한 모델이 재사용 가능한 구성 요소로 구축되는 것처럼, 많은 기존 MAS 아키텍처는 소수의 반복적인 내부 계산 패턴으로 분해될 수 있다는 점에 착안했습니다. 이러한 관찰을 바탕으로, 세 가지 프림티브인 '검토(Review)', '투표 및 선택(Voting and Selection)', 그리고 '계획 및 실행(Planning and Execution)'을 구현했습니다. 모든 프림티브는 내부적으로 키-값(KV) 캐시를 통해 통신하며, 이는 다단계 상호 작용에서 정보 손실을 완화하여 안정성과 효율성을 향상시킵니다. 자동 시스템 구축을 위해, '조직자(Organizer)' 에이전트는 이전에 성공적인 구성으로 구성된 경량 지식 풀을 기반으로 각 쿼리에 적합한 프림티브를 선택하고 조합하여 프림티브 기반 MAS를 구축합니다. 실험 결과, 프림티브 기반 MAS는 단일 에이전트 기준 대비 평균 정확도를 12.0-16.5% 향상시키고, 텍스트 기반 MAS에 비해 토큰 사용량 및 추론 지연 시간을 약 3-4배 줄이며, 단일 에이전트 추론에 비해 1.3-1.6배의 오버헤드를 발생시키면서 다양한 모델 구조에서 안정적인 성능을 제공하는 것으로 나타났습니다.
While existing multi-agent systems (MAS) can handle complex problems by enabling collaboration among multiple agents, they are often highly task-specific, relying on manually crafted agent roles and interaction prompts, which leads to increased architectural complexity and limited reusability across tasks. Moreover, most MAS communicate primarily through natural language, making them vulnerable to error accumulation and instability in long-context, multi-stage interactions within internal agent histories. In this work, we propose \textbf{Agent Primitives}, a set of reusable latent building blocks for LLM-based MAS. Inspired by neural network design, where complex models are built from reusable components, we observe that many existing MAS architectures can be decomposed into a small number of recurring internal computation patterns. Based on this observation, we instantiate three primitives: Review, Voting and Selection, and Planning and Execution. All primitives communicate internally via key-value (KV) cache, which improves both robustness and efficiency by mitigating information degradation across multi-stage interactions. To enable automatic system construction, an Organizer agent selects and composes primitives for each query, guided by a lightweight knowledge pool of previously successful configurations, forming a primitive-based MAS. Experiments show that primitives-based MAS improve average accuracy by 12.0-16.5\% over single-agent baselines, reduce token usage and inference latency by approximately 3$\times$-4$\times$ compared to text-based MAS, while incurring only 1.3$\times$-1.6$\times$ overhead relative to single-agent inference and providing more stable performance across model backbones.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.