2601.14667v1 Jan 21, 2026 cs.MA

INFA-Guard: LLM 기반 다중 에이전트 시스템에서 감염 인지 방어 메커니즘을 통한 악성 전파 완화

INFA-Guard: Mitigating Malicious Propagation via Infection-Aware Safeguarding in LLM-Based Multi-Agent Systems

Dongrui Liu
Dongrui Liu
Citations: 296
h-index: 7
Jing Shao
Jing Shao
Citations: 30
h-index: 3
Yijin Zhou
Yijin Zhou
Citations: 27
h-index: 2
Junchi Yan
Junchi Yan
Citations: 394
h-index: 6
Xiaoya Lu
Xiaoya Lu
Citations: 122
h-index: 5

최근 급속도로 발전하고 있는 대규모 언어 모델(LLM) 기반 다중 에이전트 시스템(MAS)은 상당한 보안 취약점을 야기하며, 악성 영향력이 에이전트 간 통신을 통해 급속도로 확산될 수 있습니다. 기존의 보안 장치는 일반적으로 정상 에이전트와 공격 에이전트를 엄격하게 구분하는 이분법적인 방식을 사용하며, 공격 에이전트에 의해 변환된 정상 에이전트(즉, 감염된 에이전트)를 고려하지 못합니다. 본 논문에서는 감염된 에이전트를 별도의 위협 범주로 명시적으로 식별하고 대응하는 새로운 방어 프레임워크인 Infection-Aware Guard, 즉 INFA-Guard를 제안합니다. INFA-Guard는 감염 인지 탐지 및 토폴로지 제약을 활용하여 공격의 근원지와 감염 범위를 정확하게 파악합니다. 복구 과정에서 INFA-Guard는 공격 에이전트를 제거하고, 감염된 에이전트를 복구하여 악성 전파를 방지하면서 동시에 시스템의 토폴로지 무결성을 유지합니다. 광범위한 실험 결과, INFA-Guard는 최첨단 성능을 달성하며, 공격 성공률(ASR)을 평균 33% 감소시키고, 다양한 모델에 대한 강건성, 우수한 토폴로지 일반화 능력, 높은 비용 효율성을 보여줍니다.

Original Abstract

The rapid advancement of Large Language Model (LLM)-based Multi-Agent Systems (MAS) has introduced significant security vulnerabilities, where malicious influence can propagate virally through inter-agent communication. Conventional safeguards often rely on a binary paradigm that strictly distinguishes between benign and attack agents, failing to account for infected agents i.e., benign entities converted by attack agents. In this paper, we propose Infection-Aware Guard, INFA-Guard, a novel defense framework that explicitly identifies and addresses infected agents as a distinct threat category. By leveraging infection-aware detection and topological constraints, INFA-Guard accurately localizes attack sources and infected ranges. During remediation, INFA-Guard replaces attackers and rehabilitates infected ones, avoiding malicious propagation while preserving topological integrity. Extensive experiments demonstrate that INFA-Guard achieves state-of-the-art performance, reducing the Attack Success Rate (ASR) by an average of 33%, while exhibiting cross-model robustness, superior topological generalization, and high cost-effectiveness.

1 Citations
0 Influential
3.5 Altmetric
18.5 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!