2601.22790v1 Jan 30, 2026 cs.AI

대규모 추론 모델을 위한 조건부 성능 보장

Conditional Performance Guarantee for Large Reasoning Models

Bingyi Jing
Bingyi Jing
Citations: 31
h-index: 4
Hao Zeng
Hao Zeng
Citations: 369
h-index: 5
Hongxin Wei
Hongxin Wei
Citations: 65
h-index: 5
Bo An
Bo An
Citations: 2
h-index: 1
Jianguo Huang
Jianguo Huang
Citations: 8
h-index: 1

대규모 추론 모델들은 확장된 생각의 사슬(chain-of-thought) 추론을 통해 강력한 성능을 보여주었으나, 그 계산 비용은 여전히 막대하다. 확률적 근사 정답(PAC) 추론은 사고(thinking) 모델과 비사고(non-thinking) 모델 간의 적응형 전환을 통해 효율적 추론을 위한 통계적 보장을 제공하지만, 이러한 보장은 한계적(marginal)인 경우에만 유효하며 정확한 조건부 커버리지를 제공하지 못한다. 본 연구는 입력 공간을 분할함으로써 그룹 수준에서 PAC 스타일의 보장을 제공하는 실용적 프레임워크인 G-PAC 추론을 제안한다. 우리는 알려진 그룹 구조를 위한 그룹 PAC(G-PAC) 추론과 알려지지 않은 그룹을 위한 클러스터드 PAC(C-PAC) 추론, 이 두 가지 구현체를 개발했다. 우리는 G-PAC과 C-PAC 모두 그룹 조건부 위험 제어를 달성한다는 것을 증명하고, 이질적인 환경에서 그룹화가 기존의 한계적 PAC 추론보다 효율성을 확실히 개선할 수 있음을 보인다. 다양한 추론 벤치마크에 대한 실험 결과, G-PAC과 C-PAC은 상당한 계산 비용 절감 효과를 유지하면서도 그룹 조건부 위험 제어를 성공적으로 수행함을 입증하였다.

Original Abstract

Large reasoning models have shown strong performance through extended chain-of-thought reasoning, yet their computational cost remains significant. Probably approximately correct (PAC) reasoning provides statistical guarantees for efficient reasoning by adaptively switching between thinking and non-thinking models, but the guarantee holds only in the marginal case and does not provide exact conditional coverage. We propose G-PAC reasoning, a practical framework that provides PAC-style guarantees at the group level by partitioning the input space. We develop two instantiations: Group PAC (G-PAC) reasoning for known group structures and Clustered PAC (C-PAC) reasoning for unknown groupings. We prove that both G-PAC and C-PAC achieve group-conditional risk control, and that grouping can strictly improve efficiency over marginal PAC reasoning in heterogeneous settings. Our experiments on diverse reasoning benchmarks demonstrate that G-PAC and C-PAC successfully achieve group-conditional risk control while maintaining substantial computational savings.

1 Citations
0 Influential
2.5 Altmetric
13.5 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!