2604.12663v1 Apr 14, 2026 cs.AI

목표 지향적 대비 학습 및 최적 수송을 활용한 인간 중심 토픽 모델링

Human-Centric Topic Modeling with Goal-Prompted Contrastive Learning and Optimal Transport

Yuxiang Zhou
Yuxiang Zhou
Citations: 108
h-index: 6
Philip Torr
Philip Torr
Citations: 15
h-index: 2
Y. Zheng
Y. Zheng
Citations: 375
h-index: 4
Dongxing Wang
Dongxing Wang
Citations: 0
h-index: 0
Jialin Yu
Jialin Yu
Citations: 1
h-index: 1
Rui Wang
Rui Wang
Citations: 38
h-index: 4
Haiping Huang
Haiping Huang
Citations: 36
h-index: 4
Yuanzhi Yao
Yuanzhi Yao
Citations: 15
h-index: 2

기존의 토픽 모델링 방법들은, LDA부터 최근의 신경망 및 LLM 기반 접근 방식에 이르기까지, 주로 통계적 일관성에 초점을 맞추기 때문에, 사용자의 의도를 제대로 반영하지 못하고 중복되거나 부적절한 주제를 생성하는 경우가 많습니다. 본 논문에서는 인간 중심 토픽 모델링(Human-TM)이라는 새로운 방법론을 제시합니다. Human-TM은 사용자가 제공하는 목표를 토픽 모델링 과정에 직접 통합하여, 해석 가능하고 다양한, 그리고 목표 지향적인 주제를 생성합니다. 이러한 문제를 해결하기 위해, 우리는 LLM 기반 프롬프팅을 사용하여 문서에서 목표 후보를 추출하고, 최적 수송을 통해 의미론적으로 인식하는 대비 학습을 수행하는 목표 지향적 대비 토픽 모델 (Goal-prompted Contrastive Topic Model with Optimal Transport, GCTM-OT)을 제안합니다. 세 개의 공개된 Reddit 데이터셋에 대한 실험 결과, GCTM-OT는 기존 최고 성능 모델보다 주제의 일관성 및 다양성 측면에서 우수한 성능을 보였으며, 동시에 사용자가 제공하는 목표와 더욱 일치하는 결과를 보여주었습니다. 이는 더욱 인간 중심적인 토픽 발견 시스템을 구축하는 데 기여할 것입니다.

Original Abstract

Existing topic modeling methods, from LDA to recent neural and LLM-based approaches, which focus mainly on statistical coherence, often produce redundant or off-target topics that miss the user's underlying intent. We introduce Human-centric Topic Modeling, \emph{Human-TM}), a novel task formulation that integrates a human-provided goal directly into the topic modeling process to produce interpretable, diverse and goal-oriented topics. To tackle this challenge, we propose the \textbf{G}oal-prompted \textbf{C}ontrastive \textbf{T}opic \textbf{M}odel with \textbf{O}ptimal \textbf{T}ransport (GCTM-OT), which first uses LLM-based prompting to extract goal candidates from documents, then incorporates these into semantic-aware contrastive learning via optimal transport for topic discovery. Experimental results on three public subreddit datasets show that GCTM-OT outperforms state-of-the-art baselines in topic coherence and diversity while significantly improving alignment with human-provided goals, paving the way for more human-centric topic discovery systems.

0 Citations
0 Influential
3 Altmetric
15.0 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!