2604.24657v1 Apr 27, 2026 cs.CR

AgentWard: 자율 AI 에이전트를 위한 수명 주기 보안 아키텍처

AgentWard: A Lifecycle Security Architecture for Autonomous AI Agents

Yue Xiao
Yue Xiao
Citations: 236
h-index: 8
Xinhao Deng
Xinhao Deng
Citations: 442
h-index: 8
Qi Li
Qi Li
Citations: 95
h-index: 5
Kewei Xu
Kewei Xu
Citations: 27
h-index: 3
Yixiang Zhang
Yixiang Zhang
Citations: 31
h-index: 2
Jiaqi Wu
Jiaqi Wu
Citations: 64
h-index: 3

자율 AI 에이전트는 대규모 언어 모델을 완전한 런타임 시스템으로 확장하며, 이 시스템은 기능을 로드하고, 외부 콘텐츠를 처리하고, 메모리를 유지하며, 다단계 작업을 계획하고, 특권 도구를 호출합니다. 이러한 시스템에서 보안 오류는 드물게 단일 인터페이스에 국한되며, 대신 초기화, 입력 처리, 메모리, 의사 결정 및 실행 단계를 가로질러 전파되어, 종종 유해한 영향이 환경에 나타날 때까지는 명확하게 드러나지 않습니다. 본 논문에서는 AgentWard를 소개합니다. AgentWard는 이러한 다섯 가지 단계에 걸쳐 체계적인 보호를 제공하는, 수명 주기 지향적인 다층 방어 아키텍처입니다. AgentWard는 단계별로 특화된 다양한 제어 방식을 통합하고, 계층 간의 조정을 가능하게 하여, 위협이 전파 경로를 따라 차단되도록 하면서 중요한 자산을 보호합니다. 본 논문에서는 다섯 가지 조정된 보호 계층의 설계 원리와 아키텍처를 자세히 설명하고, OpenClaw 플랫폼에서 플러그인 기반 프로토타입을 구현하여 실제 적용 가능성을 입증합니다. 본 연구는 자율 AI 에이전트에서 런타임 보안 제어를 구성하고, 신뢰 전파를 관리하고, 실행 환경을 격리하는 데 필요한 구체적인 청사진을 제공합니다. 저희의 코드는 다음 주소에서 확인할 수 있습니다: https://github.com/FIND-Lab/AgentWard.

Original Abstract

Autonomous AI agents extend large language models into full runtime systems that load skills, ingest external content, maintain memory, plan multi-step actions, and invoke privileged tools. In such systems, security failures rarely remain confined to a single interface; instead, they can propagate across initialization, input processing, memory, decision-making, and execution, often becoming apparent only when harmful effects materialize in the environment. This paper presents AgentWard, a lifecycle-oriented, defense-in-depth architecture that systematically organizes protection across these five stages. AgentWard integrates stage-specific, heterogeneous controls with cross-layer coordination, enabling threats to be intercepted along their propagation paths while safeguarding critical assets. We detail the design rationale and architecture of five coordinated protection layers, and implement a plugin-native prototype on OpenClaw to demonstrate practical feasibility. This perspective provides a concrete blueprint for structuring runtime security controls, managing trust propagation, and enforcing execution containment in autonomous AI agents. Our code is available at https://github.com/FIND-Lab/AgentWard .

0 Citations
0 Influential
42.806000578468 Altmetric
214.0 Score
Original PDF
42

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!