HyperLens: 정밀한 신뢰도 추적을 통한 LLM의 인지 노력 정량화
HyperLens: Quantifying Cognitive Effort in LLMs with Fine-grained Confidence Trajectory
대규모 언어 모델(LLM)은 다양한 작업에서 뛰어난 성능을 보이지만, 기존 분석 도구의 낮은 해상도 때문에 추론 과정에 대한 이해는 여전히 부족합니다. 본 연구에서는 트랜스포머 아키텍처에 내재된 증폭 메커니즘을 발견했습니다. 즉, 더 깊은 레이어는 레이어별 신뢰도의 작은 변화를 본질적으로 증폭시켜 정밀한 신뢰도 추적을 제공합니다. 이러한 통찰력을 바탕으로, 신뢰도 추적을 통해 추론 과정에서의 인지 노력을 정량화하도록 설계된 고해상도 분석 도구인 HyperLens를 소개합니다. 다양한 LLM과 데이터 세트를 대상으로 HyperLens를 적용한 결과, 복잡한 작업과 단순한 작업을 구분하는 일관된 신뢰도 추적의 분기를 확인할 수 있었습니다. 이러한 패턴을 정량적인 인지 노력 지표로 추상화했습니다. 분석 결과, 복잡한 작업은 일관적으로 더 높은 인지 노력을 요구한다는 근본적인 원리를 밝혀냈습니다. 마지막으로, 일반적인 지도 미세 조정(SFT)의 흔한 부작용인 인지 노력 감소가 내부 작업에서의 성능 저하를 초래할 수 있다는 메커니즘적 설명을 제공합니다.
While Large Language Models (LLMs) achieve strong performance across diverse tasks, their inference dynamics remain poorly understood because of the limited resolution of existing analysis tools. In this work, we identify an intrinsic magnification mechanism in transformer architectures: deeper layers inherently magnify the small changes of layer-wise confidence, providing a fine-grained confidence trajectory. Building on this insight, we introduce HyperLens, a high-resolution probe designed to trace confidence trajectories and quantify the cognitive effort during inference. Across LLMs and datasets, HyperLens reveals a consistent divergence in confidence trajectories that separates complex from simple tasks. We abstract this pattern into a quantitative cognitive effort metric. Our analysis reveals a fundamental principle: complex tasks consistently require higher cognitive effort. Finally, we provide a mechanistic diagnosis of a common side effect of standard Supervised Fine-Tuning (SFT): it can reduce cognitive effort and consequently degrade performance on in-domain tasks.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.