에이전트 기반 AI 추론에서의 네트워크 인식 기반 에너지 효율성: 개관
Networking-Aware Energy Efficiency in Agentic AI Inference: A Survey
최근 대규모 언어 모델(LLM)의 급속한 발전은 인지, 추론 및 행동을 통합하여 지속적인 적응을 가능하게 하는 자율 시스템인 에이전트 기반 인공지능(AI)을 촉진했습니다. 이 패러다임은 모바일 엣지 컴퓨팅, 자율 시스템 및 차세대 무선 네트워크에서 혁신적인 응용 분야를 열어주지만, 반복적인 추론과 지속적인 데이터 교환을 통해 근본적인 에너지 문제를 야기합니다. 전통적인 AI에서 병목 현상이 주로 연산 부동 소수점 연산(FLOPs)인 반면, 에이전트 기반 AI는 복합적인 연산 및 통신 에너지 비용에 직면합니다. 본 연구에서는 인지-추론-행동 주기를 포괄하는 에너지 계정 프레임워크를 제안하여 연산 및 통신 비용을 분석합니다. 모델 단순화, 연산 제어, 입력 및 어텐션 최적화, 하드웨어 인식 추론을 아우르는 통합 분류 체계를 확립합니다. 모델 파라미터, 무선 전송 및 엣지 리소스를 공동으로 최적화하는 크로스 레이어 공동 설계 전략을 탐구합니다. 마지막으로, 연합 친환경 학습, 탄소 인식 에이전트, 6세대 이동통신(6G) 기반 에이전트 기반 AI 및 자가 유지 시스템의 미해결 과제를 제시하고, 확장 가능한 자율 지능을 위한 로드맵을 제공합니다.
The rapid emergence of Large Language Models (LLMs) has catalyzed Agentic artificial intelligence (AI), autonomous systems integrating perception, reasoning, and action into closed-loop pipelines for continuous adaptation. While unlocking transformative applications in mobile edge computing, autonomous systems, and next-generation wireless networks, this paradigm creates fundamental energy challenges through iterative inference and persistent data exchange. Unlike traditional AI where bottlenecks are computational Floating Point Operations (FLOPs), Agentic AI faces compounding computational and communication energy costs. In this survey, we propose an energy accounting framework identifying computational and communication costs across the Perception-Reasoning-Action cycle. We establish a unified taxonomy spanning model simplification, computation control, input and attention optimization, and hardware-aware inference. We explore cross-layer co-design strategies jointly optimizing model parameters, wireless transmissions, and edge resources. Finally, we identify open challenges of federated green learning, carbon-aware agency, 6th generation mobile communication (6G)-native Agentic AI, and self-sustaining systems, providing a roadmap for scalable autonomous intelligence.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.