Learn-to-Distance: LLM 생성 텍스트 탐지를 위한 거리 학습
Learn-to-Distance: Distance Learning for Detecting LLM-Generated Text
GPT, Claude, Gemini와 같은 현대의 대규모 언어 모델(LLM)은 우리가 학습하고, 일하고, 소통하는 방식을 혁신했습니다. 그러나 이러한 모델이 인간과 매우 유사한 텍스트를 생성하는 능력은 허위 정보 및 학문적 정직성에 대한 심각한 우려를 야기하며, LLM이 생성한 콘텐츠를 탐지할 수 있는 신뢰할 수 있는 알고리즘의 필요성이 시급합니다. 본 논문에서는 먼저 재작성 기반 탐지 알고리즘의 작동 원리를 이해하기 위한 기하학적 접근 방식을 제시하고, 그 근거를 밝히며 일반화 능력을 보여줍니다. 이러한 통찰력을 바탕으로, 원래 텍스트와 재작성된 텍스트 간의 거리를 적응적으로 학습하는 새로운 재작성 기반 탐지 알고리즘을 소개합니다. 이론적으로, 적응적으로 학습된 거리 함수를 사용하는 것이 고정된 거리 함수를 사용하는 것보다 탐지 성능이 더 뛰어나다는 것을 입증합니다. 또한, 100가지 이상의 다양한 설정에서 광범위한 실험을 수행한 결과, 제안하는 방법이 대부분의 시나리오에서 기존 알고리즘보다 우수한 성능을 보이는 것을 확인했습니다. 특히, GPT, Claude, Gemini와 같은 다양한 LLM을 대상으로 했을 때, 제안하는 방법은 가장 강력한 기준 알고리즘보다 54.3%에서 75.4%의 상대적인 성능 향상을 달성했습니다. 본 논문에서 제안하는 방법의 파이썬 구현체는 https://github.com/Mamba413/L2D 에서 공개적으로 이용할 수 있습니다.
Modern large language models (LLMs) such as GPT, Claude, and Gemini have transformed the way we learn, work, and communicate. Yet, their ability to produce highly human-like text raises serious concerns about misinformation and academic integrity, making it an urgent need for reliable algorithms to detect LLM-generated content. In this paper, we start by presenting a geometric approach to demystify rewrite-based detection algorithms, revealing their underlying rationale and demonstrating their generalization ability. Building on this insight, we introduce a novel rewrite-based detection algorithm that adaptively learns the distance between the original and rewritten text. Theoretically, we demonstrate that employing an adaptively learned distance function is more effective for detection than using a fixed distance. Empirically, we conduct extensive experiments with over 100 settings, and find that our approach demonstrates superior performance over baseline algorithms in the majority of scenarios. In particular, it achieves relative improvements from 54.3% to 75.4% over the strongest baseline across different target LLMs (e.g., GPT, Claude, and Gemini). A python implementation of our proposal is publicly available at https://github.com/Mamba413/L2D.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.