LLM 집단 내 객관적인 의사 결정을 저해하는 핵심적인 취약점으로서의 사회적 역학
Social Dynamics as Critical Vulnerabilities that Undermine Objective Decision-Making in LLM Collectives
대규모 언어 모델(LLM) 에이전트는 점점 더 다중 에이전트 환경에서 인간의 대리인 역할을 수행하며, 대표 에이전트는 다양한 동료의 관점을 통합하여 최종 결정을 내립니다. 사회 심리학의 영감을 받아, 우리는 네트워크의 사회적 맥락이 이 대표 에이전트의 신뢰성을 어떻게 저해하는지 조사합니다. 우리는 사회적 순응, 인식된 전문성, 우세한 발화 효과, 수사적 설득이라는 네 가지 핵심 현상을 정의하고, 적대 그룹의 수, 상대적인 지능, 논쟁 길이 및 논쟁 스타일을 체계적으로 조작합니다. 우리의 실험 결과는 대표 에이전트의 정확도가 사회적 압력이 증가함에 따라 지속적으로 감소한다는 것을 보여줍니다. 더 큰 적대 그룹, 더 능숙한 동료, 더 긴 논쟁은 모두 상당한 성능 저하를 초래합니다. 또한, 신뢰성이나 논리를 강조하는 수사적 전략은 상황에 따라 에이전트의 판단에 더 큰 영향을 미칠 수 있습니다. 이러한 결과는 다중 에이전트 시스템이 개별적인 추론뿐만 아니라 구성의 사회적 역학에 민감하며, 인간 집단 의사 결정에서 관찰되는 심리적 편향을 반영하는 AI 대리인의 중요한 취약점을 강조한다는 것을 보여줍니다.
Large language model (LLM) agents are increasingly acting as human delegates in multi-agent environments, where a representative agent integrates diverse peer perspectives to make a final decision. Drawing inspiration from social psychology, we investigate how the reliability of this representative agent is undermined by the social context of its network. We define four key phenomena-social conformity, perceived expertise, dominant speaker effect, and rhetorical persuasion-and systematically manipulate the number of adversaries, relative intelligence, argument length, and argumentative styles. Our experiments demonstrate that the representative agent's accuracy consistently declines as social pressure increases: larger adversarial groups, more capable peers, and longer arguments all lead to significant performance degradation. Furthermore, rhetorical strategies emphasizing credibility or logic can further sway the agent's judgment, depending on the context. These findings reveal that multi-agent systems are sensitive not only to individual reasoning but also to the social dynamics of their configuration, highlighting critical vulnerabilities in AI delegates that mirror the psychological biases observed in human group decision-making.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.