AdaMARP: 범용 몰입형 롤플레잉을 위한 적응형 다중 에이전트 상호작용 프레임워크
AdaMARP: An Adaptive Multi-Agent Interaction Framework for General Immersive Role-Playing
LLM 롤플레잉은 상호작용적 서사에서 임의의 캐릭터를 묘사하는 것을 목표로 하지만, 기존 시스템들은 종종 제한된 몰입감과 적응성으로 인해 어려움을 겪습니다. 이들은 일반적으로 동적인 환경 정보를 충분히 모델링하지 못하고 대개 정적인 장면과 배역을 가정하기 때문에, 다중 캐릭터 조율, 장면 전환, 즉각적인 캐릭터 도입에 대한 지원이 부족합니다. 이에 우리는 [생각], (행동), <환경>, 발화를 교차하는 몰입형 메시지 형식과, 근거를 동반한 개별 행동(init_scene, pick_speaker, switch_scene, add_role, end)을 통해 롤플레잉을 관장하는 명시적인 '장면 관리자(Scene Manager)'를 특징으로 하는 적응형 다중 에이전트 롤플레잉 프레임워크인 AdaMARP를 제안합니다. 이러한 능력을 훈련하기 위해 액터 모델(Actor Model)용 AdaRPSet과 조율 결정 감독용 AdaSMSet을 구축하고, 궤적 수준의 평가를 위해 AdaptiveBench를 도입합니다. 여러 백본과 모델 규모에 걸친 실험을 통해 일관된 성능 향상을 입증했습니다. AdaRPSet은 캐릭터 일관성, 환경 반영 능력, 서사적 개연성을 향상시켜 8B 크기의 액터 모델이 여러 상용 LLM을 능가하는 성능을 보였으며, AdaSMSet은 단 14B LLM만으로도 Claude Sonnet 4.5를 능가하며 더 부드러운 장면 전환과 자연스러운 역할 도입을 가능하게 했습니다.
LLM role-playing aims to portray arbitrary characters in interactive narratives, yet existing systems often suffer from limited immersion and adaptability. They typically under-model dynamic environmental information and assume largely static scenes and casts, offering insufficient support for multi-character orchestration, scene transitions, and on-the-fly character introduction. We propose an adaptive multi-agent role-playing framework, AdaMARP, featuring an immersive message format that interleaves [Thought], (Action), <Environment>, and Speech, together with an explicit Scene Manager that governs role-playing through discrete actions (init_scene, pick_speaker, switch_scene, add_role, end) accompanied by rationales. To train these capabilities, we construct AdaRPSet for the Actor Model and AdaSMSet for supervising orchestration decisions, and introduce AdaptiveBench for trajectory-level evaluation. Experiments across multiple backbones and model scales demonstrate consistent improvements: AdaRPSet enhances character consistency, environment grounding, and narrative coherence, with an 8B actor outperforming several commercial LLMs, while AdaSMSet enables smoother scene transitions and more natural role introductions, surpassing Claude Sonnet 4.5 using only a 14B LLM.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.