INFA-Guard: LLM 기반 다중 에이전트 시스템에서 감염 인지 방어 메커니즘을 통한 악성 전파 완화
INFA-Guard: Mitigating Malicious Propagation via Infection-Aware Safeguarding in LLM-Based Multi-Agent Systems
최근 급속도로 발전하고 있는 대규모 언어 모델(LLM) 기반 다중 에이전트 시스템(MAS)은 상당한 보안 취약점을 야기하며, 악성 영향력이 에이전트 간 통신을 통해 급속도로 확산될 수 있습니다. 기존의 보안 장치는 일반적으로 정상 에이전트와 공격 에이전트를 엄격하게 구분하는 이분법적인 방식을 사용하며, 공격 에이전트에 의해 변환된 정상 에이전트(즉, 감염된 에이전트)를 고려하지 못합니다. 본 논문에서는 감염된 에이전트를 별도의 위협 범주로 명시적으로 식별하고 대응하는 새로운 방어 프레임워크인 Infection-Aware Guard, 즉 INFA-Guard를 제안합니다. INFA-Guard는 감염 인지 탐지 및 토폴로지 제약을 활용하여 공격의 근원지와 감염 범위를 정확하게 파악합니다. 복구 과정에서 INFA-Guard는 공격 에이전트를 제거하고, 감염된 에이전트를 복구하여 악성 전파를 방지하면서 동시에 시스템의 토폴로지 무결성을 유지합니다. 광범위한 실험 결과, INFA-Guard는 최첨단 성능을 달성하며, 공격 성공률(ASR)을 평균 33% 감소시키고, 다양한 모델에 대한 강건성, 우수한 토폴로지 일반화 능력, 높은 비용 효율성을 보여줍니다.
The rapid advancement of Large Language Model (LLM)-based Multi-Agent Systems (MAS) has introduced significant security vulnerabilities, where malicious influence can propagate virally through inter-agent communication. Conventional safeguards often rely on a binary paradigm that strictly distinguishes between benign and attack agents, failing to account for infected agents i.e., benign entities converted by attack agents. In this paper, we propose Infection-Aware Guard, INFA-Guard, a novel defense framework that explicitly identifies and addresses infected agents as a distinct threat category. By leveraging infection-aware detection and topological constraints, INFA-Guard accurately localizes attack sources and infected ranges. During remediation, INFA-Guard replaces attackers and rehabilitates infected ones, avoiding malicious propagation while preserving topological integrity. Extensive experiments demonstrate that INFA-Guard achieves state-of-the-art performance, reducing the Attack Success Rate (ASR) by an average of 33%, while exhibiting cross-model robustness, superior topological generalization, and high cost-effectiveness.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.