추론 기반 AIGC 탐지: 정렬 및 강화 학습을 활용
Reasoning-Aware AIGC Detection via Alignment and Reinforcement
대규모 언어 모델(LLM)의 급속한 발전과 광범위한 활용은 신뢰성 있는 AI 생성 콘텐츠(AIGC) 탐지의 필요성을 높였지만, 모델의 진화로 인해 여전히 어려운 과제로 남아 있습니다. 본 연구에서는 다양한 LLM 소스와 저작 환경을 포함하는 포괄적인 다중 도메인 데이터셋인 AIGC-text-bank를 소개하고, 분류 전에 해석 가능한 추론 과정을 생성하는 탐지 프레임워크인 REVEAL을 제안합니다. REVEAL은 두 단계의 학습 전략을 사용합니다. 먼저, 지도 학습을 통해 추론 능력을 구축하고, 그 다음에는 강화 학습을 통해 정확도를 향상시키고, 논리적 일관성을 개선하며, 환각 현상을 줄입니다. 광범위한 실험 결과, REVEAL은 여러 벤치마크에서 최첨단 성능을 달성했으며, AIGC 탐지를 위한 강력하고 투명한 솔루션을 제공합니다. 본 프로젝트는 https://aka.ms/reveal 에서 오픈 소스로 제공됩니다.
The rapid advancement and widespread adoption of Large Language Models (LLMs) have elevated the need for reliable AI-generated content (AIGC) detection, which remains challenging as models evolve. We introduce AIGC-text-bank, a comprehensive multi-domain dataset with diverse LLM sources and authorship scenarios, and propose REVEAL, a detection framework that generates interpretable reasoning chains before classification. Our approach uses a two-stage training strategy: supervised fine-tuning to establish reasoning capabilities, followed by reinforcement learning to improve accuracy, improve logical consistency, and reduce hallucinations. Extensive experiments show that REVEAL achieves state-of-the-art performance across multiple benchmarks, offering a robust and transparent solution for AIGC detection. The project is open-source at https://aka.ms/reveal
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.