2604.07857v1 Apr 09, 2026 eess.SY

에이전트 기반 AI 추론에서의 네트워크 인식 기반 에너지 효율성: 개관

Networking-Aware Energy Efficiency in Agentic AI Inference: A Survey

D. Niyato
D. Niyato
Citations: 117
h-index: 5
Ruichen Zhang
Ruichen Zhang
Citations: 2,458
h-index: 23
Xiaojing Chen
Xiaojing Chen
Citations: 986
h-index: 18
Wei Ni
Wei Ni
Citations: 5
h-index: 2
Xin Wang
Xin Wang
Citations: 17
h-index: 2
Shunqing Zhang
Shunqing Zhang
Citations: 105
h-index: 6
Haiqiu Yu
Haiqiu Yu
Citations: 4
h-index: 1
Shugong Xu
Shugong Xu
Citations: 37
h-index: 3

최근 대규모 언어 모델(LLM)의 급속한 발전은 인지, 추론 및 행동을 통합하여 지속적인 적응을 가능하게 하는 자율 시스템인 에이전트 기반 인공지능(AI)을 촉진했습니다. 이 패러다임은 모바일 엣지 컴퓨팅, 자율 시스템 및 차세대 무선 네트워크에서 혁신적인 응용 분야를 열어주지만, 반복적인 추론과 지속적인 데이터 교환을 통해 근본적인 에너지 문제를 야기합니다. 전통적인 AI에서 병목 현상이 주로 연산 부동 소수점 연산(FLOPs)인 반면, 에이전트 기반 AI는 복합적인 연산 및 통신 에너지 비용에 직면합니다. 본 연구에서는 인지-추론-행동 주기를 포괄하는 에너지 계정 프레임워크를 제안하여 연산 및 통신 비용을 분석합니다. 모델 단순화, 연산 제어, 입력 및 어텐션 최적화, 하드웨어 인식 추론을 아우르는 통합 분류 체계를 확립합니다. 모델 파라미터, 무선 전송 및 엣지 리소스를 공동으로 최적화하는 크로스 레이어 공동 설계 전략을 탐구합니다. 마지막으로, 연합 친환경 학습, 탄소 인식 에이전트, 6세대 이동통신(6G) 기반 에이전트 기반 AI 및 자가 유지 시스템의 미해결 과제를 제시하고, 확장 가능한 자율 지능을 위한 로드맵을 제공합니다.

Original Abstract

The rapid emergence of Large Language Models (LLMs) has catalyzed Agentic artificial intelligence (AI), autonomous systems integrating perception, reasoning, and action into closed-loop pipelines for continuous adaptation. While unlocking transformative applications in mobile edge computing, autonomous systems, and next-generation wireless networks, this paradigm creates fundamental energy challenges through iterative inference and persistent data exchange. Unlike traditional AI where bottlenecks are computational Floating Point Operations (FLOPs), Agentic AI faces compounding computational and communication energy costs. In this survey, we propose an energy accounting framework identifying computational and communication costs across the Perception-Reasoning-Action cycle. We establish a unified taxonomy spanning model simplification, computation control, input and attention optimization, and hardware-aware inference. We explore cross-layer co-design strategies jointly optimizing model parameters, wireless transmissions, and edge resources. Finally, we identify open challenges of federated green learning, carbon-aware agency, 6th generation mobile communication (6G)-native Agentic AI, and self-sustaining systems, providing a roadmap for scalable autonomous intelligence.

0 Citations
0 Influential
11.5 Altmetric
57.5 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!