LLM은 인간의 공감 능력을 명시적으로 포함해야 한다
LLMs Should Incorporate Explicit Mechanisms for Human Empathy
본 논문은 대규모 언어 모델(LLM)이 인간의 공감 능력을 명시적으로 포함해야 한다고 주장합니다. LLM이 점점 더 많은 고위험의 인간 중심 환경에 적용됨에 따라, LLM의 성공은 정확성이나 유창성뿐만 아니라 인간의 관점을 충실하게 반영하는 능력에 달려 있습니다. 그러나 현재의 LLM은 이러한 요구 사항을 체계적으로 충족하지 못합니다. 잘 정렬되고 정책을 준수하더라도, 종종 감정을 희석시키고, 맥락의 중요성을 왜곡하며, 관계적인 태도를 경직시켜 의미를 왜곡하는 경향이 있습니다. 본 논문에서는 공감을 관찰 가능한 행동 특성, 즉 의도, 감정, 맥락을 유지하면서 인간의 관점을 모델링하고 반응하는 능력으로 정의합니다. 이러한 정의를 바탕으로, 현대 LLM에서 나타나는 네 가지 공감 실패 메커니즘(감정 희석, 공감 세부 사항 불일치, 갈등 회피, 언어적 거리감)을 식별하며, 이는 현재의 훈련 및 정렬 방식의 구조적 결과로 발생합니다. 또한 이러한 실패를 인지적, 문화적, 관계적 공감의 세 가지 차원으로 분류하여 다양한 작업에서 나타나는 현상을 설명합니다. 실증적 분석 결과, 우수한 벤치마크 성능이 체계적인 공감 왜곡을 가릴 수 있으며, 이는 LLM 개발의 핵심 요소로서 공감 능력을 고려한 목표, 벤치마크 및 훈련 신호의 필요성을 강조합니다.
This paper argues that Large Language Models (LLMs) should incorporate explicit mechanisms for human empathy. As LLMs become increasingly deployed in high-stakes human-centered settings, their success depends not only on correctness or fluency but on faithful preservation of human perspectives. Yet, current LLMs systematically fail at this requirement: even when well-aligned and policy-compliant, they often attenuate affect, misrepresent contextual salience, and rigidify relational stance in ways that distort meaning. We formalize empathy as an observable behavioral property: the capacity to model and respond to human perspectives while preserving intention, affect, and context. Under this framing, we identify four recurring mechanisms of empathic failure in contemporary LLMs--sentiment attenuation, empathic granularity mismatch, conflict avoidance, and linguistic distancing--arising as structural consequences of prevailing training and alignment practices. We further organize these failures along three dimensions: cognitive, cultural, and relational empathy, to explain their manifestation across tasks. Empirical analyses show that strong benchmark performance can mask systematic empathic distortions, motivating empathy-aware objectives, benchmarks, and training signals as first-class components of LLM development.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.