도덕적 관점, 정치적 좌표: 도덕적으로 조건화된 LLM의 이념적 위치 설정
Moral Lenses, Political Coordinates: Towards Ideological Positioning of Morally Conditioned LLMs
최근 연구에서는 대규모 언어 모델(LLM)의 정치적 성향을 체계적으로 분석했지만, 기존의 평가는 주로 직접적인 검증이나 인구통계학적 페르소나 조작을 통해 이념적 편향을 드러내는 데 의존했습니다. 사회 심리학에서는 정치적 이념이 근본적인 도덕적 직관의 결과로도 이해됩니다. 본 연구에서는 도덕적 지향을 제어 가능한 조건으로 간주하여, 도덕적 가치와 정치적 위치 간의 인과 관계를 조사합니다. 단순히 인구통계학적 페르소나를 부여하는 대신, 모델이 특정 도덕적 가치를 지지하거나 거부하도록 학습시키고, 정치적 좌표를 Political Compass 테스트를 사용하여 평가합니다. 도덕적 가치를 '렌즈'로 간주하여, 도덕적 조건화가 모델의 경제적 및 사회적 차원에 걸쳐 어떤 영향을 미치는지 관찰합니다. 연구 결과, 이러한 조건화는 모델의 정치적 좌표에 뚜렷하고 가치별로 구체적인 변화를 야기합니다. 또한, 이러한 효과는 역할 부여 방식과 모델 규모에 의해 체계적으로 조절되며, 동일한 도덕적 가치를 나타내는 다른 평가 도구에서도 일관성을 보입니다. 이는 효과적인 정렬을 위해서는 정치적 평가를 보다 광범위한 사회적 가치, 특히 도덕의 맥락 안에서 이루어져야 함을 시사하며, 이를 통해 사회적으로 더욱 안정적인 정렬 기술을 개발할 수 있습니다.
While recent research has systematically documented political orientation in large language models (LLMs), existing evaluations rely primarily on direct probing or demographic persona engineering to surface ideological biases. In social psychology, however, political ideology is also understood as a downstream consequence of fundamental moral intuitions. In this work, we investigate the causal relationship between moral values and political positioning by treating moral orientation as a controllable condition. Rather than simply assigning a demographic persona, we condition models to endorse or reject specific moral values and evaluate the resulting shifts on their political orientations, using the Political Compass Test. By treating moral values as lenses, we observe how moral conditioning actively steers model trajectories across economic and social dimensions. Our findings show that such conditioning induces pronounced, value-specific shifts in models' political coordinates. We further notice that these effects are systematically modulated by role framing and model scale, and are robust across alternative assessment instruments instantiating the same moral value. This highlights that effective alignment requires anchoring political assessments within the context of broader social values including morality, paving the way for more socially grounded alignment techniques.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.