2603.20161v1 Mar 20, 2026 cs.CL

대규모 언어 모델에서의 효율적인 불확실성 정량화를 위한 의미 토큰 클러스터링

Semantic Token Clustering for Efficient Uncertainty Quantification in Large Language Models

Takeshi Kojima
Takeshi Kojima
Citations: 7,106
h-index: 6
Yusuke Iwasawa
Yusuke Iwasawa
Citations: 10,187
h-index: 21
Yutaka Matsuo
Yutaka Matsuo
Citations: 1,364
h-index: 11
Qi Cao
Qi Cao
Citations: 54
h-index: 4
Andrew Gambardella
Andrew Gambardella
Citations: 146
h-index: 4

대규모 언어 모델(LLM)은 다양한 작업에서 뛰어난 성능을 보여주었습니다. 그러나 모델의 출력 결과가 항상 진실되다고 보장할 수 없으며, 과도한 확신 경향은 신뢰성을 더욱 제한합니다. 불확실성 정량화는 잠재적으로 신뢰할 수 없는 출력을 식별하는 유망한 방법이지만, 대부분의 기존 방법은 반복적인 샘플링 또는 보조 모델에 의존하여 상당한 계산 오버헤드를 발생시킵니다. 이러한 한계를 해결하기 위해, 본 논문에서는 대규모 언어 모델에 내재된 의미 정보를 활용하는 효율적인 불확실성 정량화 방법인 의미 토큰 클러스터링(STC)을 제안합니다. 구체적으로, 임베딩 클러스터링 및 접두사 매칭을 사용하여 의미적으로 일관된 토큰 그룹을 만들고, 해당 의미 클러스터에 할당된 확률 질량을 기반으로 불확실성을 정량화합니다. 제안하는 방법은 단일 생성 과정만으로 구현 가능하며, 보조 모델에 의존하지 않습니다. 실험 결과는 STC가 최첨단 기준 성능과 비교할 수 있는 성능을 달성하면서도 계산 오버헤드를 크게 줄인다는 것을 보여줍니다.

Original Abstract

Large language models (LLMs) have demonstrated remarkable capabilities across diverse tasks. However, the truthfulness of their outputs is not guaranteed, and their tendency toward overconfidence further limits reliability. Uncertainty quantification offers a promising way to identify potentially unreliable outputs, but most existing methods rely on repeated sampling or auxiliary models, introducing substantial computational overhead. To address these limitations, we propose Semantic Token Clustering (STC), an efficient uncertainty quantification method that leverages the semantic information inherently encoded in LLMs. Specifically, we group tokens into semantically consistent clusters using embedding clustering and prefix matching, and quantify uncertainty based on the probability mass aggregated over the corresponding semantic cluster. Our approach requires only a single generation and does not depend on auxiliary models. Experimental results show that STC achieves performance comparable to state-of-the-art baselines while substantially reducing computational overhead.

0 Citations
0 Influential
10.5 Altmetric
52.5 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!