2603.07138v1 Mar 07, 2026 cs.CL

대화에서의 감정 기록: 자연어를 통해 미묘하고 복잡한 감정 상태를 포착하기 위한 벤치마크

Emotion Transcription in Conversation: A Benchmark for Capturing Subtle and Complex Emotional States through Natural Language

Ryuichi Uehara
Ryuichi Uehara
Citations: 3
h-index: 1
K. Inoue
K. Inoue
Citations: 970
h-index: 19
Michimasa Inaba
Michimasa Inaba
Citations: 4
h-index: 1
Yoshiki Tanaka
Yoshiki Tanaka
Citations: 3
h-index: 1

대화에서의 감정 인식(Emotion Recognition in Conversation, ERC)은 자연스러운 인간-기계 상호작용을 가능하게 하는 데 매우 중요합니다. 그러나 기존 방법은 주로 범주형 또는 차원형 감정 어노테이션을 사용하는데, 이는 복잡하고 미묘하거나 문화적으로 특정한 감정적 뉘앙스를 충분히 반영하지 못하는 경우가 많습니다. 이러한 한계를 극복하기 위해, 우리는 대화에서의 감정 기록(Emotion Transcription in Conversation, ETC)이라는 새로운 과제를 제안합니다. 이 과제는 대화 맥락 내에서 화자의 감정 상태를 정확하게 반영하는 자연어 설명을 생성하는 데 중점을 둡니다. ETC 과제를 해결하기 위해, 우리는 참가자들이 자신의 감정 상태를 자연어로 설명한 텍스트 기반 대화로 구성된 일본어 데이터셋을 구축했습니다. 이 데이터셋에는 각 기록에 대한 감정 범주 레이블도 포함되어 있어, 정량적 분석을 가능하게 하고 ERC에 적용할 수 있습니다. 우리는 기준 모델을 사용하여 성능을 평가한 결과, 우리 데이터셋으로 모델을 미세 조정하면 성능이 향상되지만, 현재 모델은 여전히 암묵적인 감정 상태를 추론하는 데 어려움을 겪는다는 것을 확인했습니다. ETC 과제는 대화에서 더욱 풍부한 감정 이해에 대한 추가 연구를 장려할 것입니다. 데이터셋은 다음 주소에서 공개적으로 이용할 수 있습니다: https://github.com/UEC-InabaLab/ETCDataset.

Original Abstract

Emotion Recognition in Conversation (ERC) is critical for enabling natural human-machine interactions. However, existing methods predominantly employ categorical or dimensional emotion annotations, which often fail to adequately represent complex, subtle, or culturally specific emotional nuances. To overcome this limitation, we propose a novel task named Emotion Transcription in Conversation (ETC). This task focuses on generating natural language descriptions that accurately reflect speakers' emotional states within conversational contexts. To address the ETC, we constructed a Japanese dataset comprising text-based dialogues annotated with participants' self-reported emotional states, described in natural language. The dataset also includes emotion category labels for each transcription, enabling quantitative analysis and its application to ERC. We benchmarked baseline models, finding that while fine-tuning on our dataset enhances model performance, current models still struggle to infer implicit emotional states. The ETC task will encourage further research into more expressive emotion understanding in dialogue. The dataset is publicly available at https://github.com/UEC-InabaLab/ETCDataset.

0 Citations
0 Influential
41.489476363992 Altmetric
207.4 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!