LLM 에이전트를 활용한 행정적 복잡성(관료주의적 절차)에 대한 시민들의 감정 반응의 문화 간 시뮬레이션
Cross-Cultural Simulation of Citizen Emotional Responses to Bureaucratic Red Tape Using LLM Agents
정책 결정 개선은 공공 행정의 핵심 과제입니다. 기존의 인간 대상 연구에 따르면, 정책 시행 과정에서 시민들의 감정 반응은 문화권에 따라 상당한 차이를 보입니다. LLM 에이전트는 인간과 유사한 반응을 시뮬레이션하고 실험 비용을 절감할 수 있는 잠재력을 제공하지만, 행정적 복잡성에 대한 문화적으로 적절한 감정 반응을 생성하는 능력은 아직 검증되지 않았습니다. 이러한 격차를 해소하기 위해, 우리는 다양한 문화적 맥락에서 LLM의 감정 반응을 평가하기 위한 평가 프레임워크를 제안합니다. 파일럿 연구로, 이 프레임워크를 단일한 행정적 복잡성 시나리오에 적용했습니다. 우리의 결과는 모든 모델이 인간의 감정 반응과 제한적인 일관성을 보이며, 특히 동양 문화권에서 성능이 현저히 낮다는 것을 보여줍니다. 문화적 프롬프팅 전략은 일관성을 향상시키는 데 큰 효과가 없는 것으로 나타났습니다. 또한, 시민들의 행정적 복잡성에 대한 감정 반응을 시뮬레이션하고 모델 개선을 위한 인간 데이터를 수집할 수 있는 대화형 인터페이스인 **RAMO**를 소개합니다. 이 인터페이스는 https://ramo-chi.ivia.ch 에서 공개적으로 이용할 수 있습니다.
Improving policymaking is a central concern in public administration. Prior human subject studies reveal substantial cross-cultural differences in citizens' emotional responses to red tape during policy implementation. While LLM agents offer opportunities to simulate human-like responses and reduce experimental costs, their ability to generate culturally appropriate emotional responses to red tape remains unverified. To address this gap, we propose an evaluation framework for assessing LLMs' emotional responses to red tape across diverse cultural contexts. As a pilot study, we apply this framework to a single red-tape scenario. Our results show that all models exhibit limited alignment with human emotional responses, with notably weaker performance in Eastern cultures. Cultural prompting strategies prove largely ineffective in improving alignment. We further introduce \textbf{RAMO}, an interactive interface for simulating citizens' emotional responses to red tape and for collecting human data to improve models. The interface is publicly available at https://ramo-chi.ivia.ch.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.