RECUR: 재귀적 엔트로피 유도 반사실적 활용 및 성찰을 통한 자원 고갈 공격
RECUR: Resource Exhaustion Attack via Recursive-Entropy Guided Counterfactual Utilization and Reflection
거대 추론 모델(LRM)은 복잡한 과업을 해결하기 위해 추론을 사용한다. 이러한 명시적 추론은 긴 문맥 길이를 필요로 하며, 결과적으로 상당히 높은 자원 소비를 초래한다. 선행 연구에서는 적대적으로 조작된 입력이 불필요한 추론 과정을 유발하여 LRM을 자원 고갈 취약점에 노출시킬 수 있음을 보여주었다. 그러나 추론 과정 자체, 특히 성찰(reflection) 요소는 과도한 성찰을 유발하고 막대한 컴퓨팅 파워를 소모할 수 있음에도 불구하고 상대적으로 주목을 덜 받아왔다. 본 논문에서는 성찰 과정에서의 자원 소비 위험을 정량화하기 위해 '재귀적 엔트로피(Recursive Entropy)'를 도입하여, 추론 자체에 내재된 안전성 문제를 규명한다. 이를 바탕으로 우리는 재귀적 엔트로피가 유도하는 반사실적 활용 및 성찰을 이용한 자원 고갈 공격인 RECUR를 제안한다. RECUR는 반사실적 질문을 생성하여 LRM의 내재적 결함과 위험을 검증한다. 광범위한 실험을 통해 일반적인 추론 상황에서는 재귀적 엔트로피가 뚜렷한 감소 추세를 보임을 입증하였다. RECUR는 이러한 추세를 교란하여 출력 길이를 최대 11배 증가시키고 처리량을 90% 감소시킨다. 본 연구는 견고한 추론에 대한 새로운 관점을 제시한다.
Large Reasoning Models (LRMs) employ reasoning to address complex tasks. Such explicit reasoning requires extended context lengths, resulting in substantially higher resource consumption. Prior work has shown that adversarially crafted inputs can trigger redundant reasoning processes, exposing LRMs to resource-exhaustion vulnerabilities. However, the reasoning process itself, especially its reflective component, has received limited attention, even though it can lead to over-reflection and consume excessive computing power. In this paper, we introduce Recursive Entropy to quantify the risk of resource consumption in reflection, thereby revealing the safety issues inherent in inference itself. Based on Recursive Entropy, we introduce RECUR, a resource exhaustion attack via Recursive Entropy guided Counterfactual Utilization and Reflection. It constructs counterfactual questions to verify the inherent flaws and risks of LRMs. Extensive experiments demonstrate that, under benign inference, recursive entropy exhibits a pronounced decreasing trend. RECUR disrupts this trend, increasing the output length by up to 11x and decreasing throughput by 90%. Our work provides a new perspective on robust reasoning.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.