에이전트 기반 인공지능을 활용한 신체 감각 기반 빔 예측: 저고도 경제 네트워크
Agentic AI for Embodied-enhanced Beam Prediction in Low-Altitude Economy Networks
밀리미터파 또는 테라헤르츠 통신은 고처리량 센싱 및 실시간 의사 결정을 위한 저고도 경제 네트워크의 요구 사항을 충족할 수 있습니다. 그러나 무선 채널의 고주파 특성은 심각한 전파 손실과 강한 빔 지향성을 유발하여, 고기동 무인 항공기(UAV) 시나리오에서 빔 예측을 어렵게 만듭니다. 본 논문에서는 에이전트 기반 인공지능을 활용하여 밀리미터파 기지국을 지능형 시스템으로 변환합니다. 우리는 UAV-지상 밀리미터파 통신을 위한 다중 에이전트 협업 추론 아키텍처를 새롭게 설계하고, 양방향 데이터 기반의 하이브리드 빔 예측 모델 시스템을 제안합니다. 다중 에이전트 아키텍처는 대규모 언어 모델(LLM) 기반 추론의 제한된 컨텍스트 창과 약한 제어 가능성을 극복하기 위해 빔 예측을 작업 분석, 솔루션 계획 및 완전성 평가로 분해하도록 설계되었습니다. 에이전트 기반 추론 프로세스와 일치하도록, 숫자 기반 이동 정보 및 시각적 관찰을 포함한 다중 모드 UAV 데이터를 처리하는 하이브리드 빔 예측 모델 시스템을 개발했습니다. 제안된 하이브리드 모델 시스템은 Mamba 기반의 시간 모델링, 컨볼루션 기반 시각적 인코딩 및 크로스 어텐션 기반 다중 모드 융합을 통합하며, 다중 에이전트의 지침에 따라 데이터 흐름 전략을 동적으로 전환합니다. 실제 UAV 밀리미터파 통신 데이터 세트를 사용한 광범위한 시뮬레이션 결과, 제안된 아키텍처와 시스템은 다양한 데이터 조건에서 높은 예측 정확도와 안정성을 달성하며, 최대 top-1 정확도가 96.57%에 달했습니다.
Millimeter-wave or terahertz communications can meet demands of low-altitude economy networks for high-throughput sensing and real-time decision making. However, high-frequency characteristics of wireless channels result in severe propagation loss and strong beam directivity, which make beam prediction challenging in highly mobile uncrewed aerial vehicles (UAV) scenarios. In this paper, we employ agentic AI to enable the transformation of mmWave base stations toward embodied intelligence. We innovatively design a multi-agent collaborative reasoning architecture for UAV-to-ground mmWave communications and propose a hybrid beam prediction model system based on bimodal data. The multi-agent architecture is designed to overcome the limited context window and weak controllability of large language model (LLM)-based reasoning by decomposing beam prediction into task analysis, solution planning, and completeness assessment. To align with the agentic reasoning process, a hybrid beam prediction model system is developed to process multimodal UAV data, including numeric mobility information and visual observations. The proposed hybrid model system integrates Mamba-based temporal modelling, convolutional visual encoding, and cross-attention-based multimodal fusion, and dynamically switches data-flow strategies under multi-agent guidance. Extensive simulations on a real UAV mmWave communication dataset demonstrate that proposed architecture and system achieve high prediction accuracy and robustness under diverse data conditions, with maximum top-1 accuracy reaching 96.57%.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.