다중 에이전트 협력을 위한 명시적 특성 추론
Explicit Trait Inference for Multi-Agent Coordination
LLM 기반 다중 에이전트 시스템(MAS)은 복잡한 작업에서 잠재력을 보이지만, 여전히 목표 이탈, 오류 연쇄, 비정렬된 행동과 같은 협력 실패에 취약합니다. 본 연구에서는 협력을 향상시키는 심리학적으로 기반한 방법인 명시적 특성 추론(Explicit Trait Inference, ETI)을 제안합니다. ETI는 에이전트가 상호 작용 기록으로부터 신뢰와 같은 '따뜻함(warmth)' 및 기술과 같은 '능력(competence)'이라는 두 가지 확립된 심리적 차원을 따라 파트너의 특성을 추론하고 추적하여 의사 결정을 돕습니다. 우리는 통제된 환경(경제 게임)에서 ETI를 평가한 결과, 보상 손실을 45-77% 감소시켰으며, 보다 현실적이고 복잡한 다중 에이전트 환경(MultiAgentBench)에서는 시나리오와 모델에 따라 3-29%의 성능 향상을 보였습니다(CoT 기준). 추가 분석 결과, 이러한 이점은 특성 추론과 밀접하게 관련되어 있음을 확인했습니다. ETI 프로필은 에이전트의 행동을 예측하며, 유용한 프로필은 성능 향상을 이끌었습니다. 이러한 결과는 ETI가 다양한 다중 에이전트 환경에서 협력을 향상시키는 가볍고 강력한 메커니즘임을 보여주며, LLM 에이전트가 (i) 상호 작용 기록으로부터 다른 에이전트의 특성을 안정적으로 추론할 수 있으며 (ii) 다른 에이전트의 특성에 대한 체계적인 이해를 활용하여 협력을 이룰 수 있다는 최초의 체계적인 증거를 제공합니다.
LLM-based multi-agent systems (MAS) show promise on complex tasks but remain prone to coordination failures such as goal drift, error cascades, and misaligned behaviors. We propose Explicit Trait Inference (ETI), a psychologically grounded method for improving coordination. ETI enables agents to infer and track partner characteristics along two established psychological dimensions--warmth (e.g., trust) and competence (e.g., skill)--from interaction histories to guide decisions. We evaluate ETI in controlled settings (economic games), where it reduces payoff loss by 45-77%, and in more realistic, complex multi-agent settings (MultiAgentBench), where it improves performance by 3-29% depending on the scenario and model, relative to a CoT baseline. Additional analysis shows that gains are closely linked to trait inference: ETI profiles predict agents' actions, and informative profiles drive improvements. These results highlight ETI as a lightweight and robust mechanism for improving coordination in diverse multi-agent settings, and provide the first systematic evidence that LLM agents can (i) reliably infer others' traits from interaction histories and (ii) leverage structured awareness of others' traits for coordination.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.