2604.02954v1 Apr 03, 2026 cs.CL

LogicPoison: 그래프 검색 기반 생성 모델에 대한 논리적 공격

LogicPoison: Logical Attacks on Graph Retrieval-Augmented Generation

Jin Chen
Jin Chen
Citations: 8,834
h-index: 6
Chuang Zhou
Chuang Zhou
Citations: 132
h-index: 7
Yujing Zhang
Yujing Zhang
Citations: 39
h-index: 4
Qinggang Zhang
Qinggang Zhang
Citations: 822
h-index: 14
Yilin Xiao
Yilin Xiao
Citations: 28
h-index: 2
Longhao Yang
Longhao Yang
Citations: 0
h-index: 0
Lingfei Ren
Lingfei Ren
Citations: 9
h-index: 2
Xin Yang
Xin Yang
Citations: 242
h-index: 6
Xiao Huang
Xiao Huang
Citations: 189
h-index: 7

그래프 기반 검색 증강 생성(GraphRAG) 시스템은 대규모 언어 모델(LLM)의 추론 능력을 향상시키기 위해 구조화된 지식 그래프를 활용합니다. 커뮤니티 탐지 및 관계 필터링 기술을 통해 GraphRAG 시스템은 텍스트 오염 및 프롬프트 주입과 같은 기존 RAG 공격에 대한 내성을 갖는 것으로 나타났습니다. 그러나 본 논문에서는 GraphRAG 시스템의 보안이 근본적으로 기반 그래프의 위상적 무결성에 의존하며, 이는 표면 수준의 텍스트 의미를 변경하지 않고도 논리적 연결을 암묵적으로 손상시켜 손상될 수 있다는 점을 발견했습니다. 이러한 취약점을 악용하기 위해, 우리는 거짓 내용을 주입하는 대신 논리적 추론을 목표로 하는 새로운 공격 프레임워크인 extsc{LogicPoison}을 제안합니다. 특히, extsc{LogicPoison}은 전역 논리 허브를 교란하여 전체 그래프 연결을 파괴하고, 쿼리별 추론 브릿지를 분리하여 필수적인 다중 홉 추론 경로를 끊는 유형 보존 엔터티 교환 메커니즘을 사용합니다. 이 접근 방식은 유효한 추론을 효과적으로 잘못된 경로로 유도하면서 표면 수준의 텍스트의 타당성을 유지합니다. 다양한 벤치마크에 대한 종합적인 실험 결과는 extsc{LogicPoison}이 GraphRAG의 방어를 성공적으로 우회하고 성능을 크게 저하시키며, 효과성과 은밀성 측면에서 최첨단 기준 모델보다 우수한 성능을 보인다는 것을 보여줍니다. 저희의 코드는 다음 주소에서 확인할 수 있습니다: extcolor{blue}https://github.com/Jord8061/logicPoison.

Original Abstract

Graph-based Retrieval-Augmented Generation (GraphRAG) enhances the reasoning capabilities of Large Language Models (LLMs) by grounding their responses in structured knowledge graphs. Leveraging community detection and relation filtering techniques, GraphRAG systems demonstrate inherent resistance to traditional RAG attacks, such as text poisoning and prompt injection. However, in this paper, we find that the security of GraphRAG systems fundamentally relies on the topological integrity of the underlying graph, which can be undermined by implicitly corrupting the logical connections, without altering surface-level text semantics. To exploit this vulnerability, we propose \textsc{LogicPoison}, a novel attack framework that targets logical reasoning rather than injecting false contents. Specifically, \textsc{LogicPoison} employs a type-preserving entity swapping mechanism to perturb both global logic hubs for disrupting overall graph connectivity and query-specific reasoning bridges for severing essential multi-hop inference paths. This approach effectively reroutes valid reasoning into dead ends while maintaining surface-level textual plausibility. Comprehensive experiments across multiple benchmarks demonstrate that \textsc{LogicPoison} successfully bypasses GraphRAG's defenses, significantly degrading performance and outperforming state-of-the-art baselines in both effectiveness and stealth. Our code is available at \textcolor{blue}https://github.com/Jord8061/logicPoison.

0 Citations
0 Influential
37.397207708399 Altmetric
187.0 Score
Original PDF
7

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!