대규모 언어 모델 기반의 무인 항공기 운영 및 통신: 다각적인 조사 및 튜토리얼
Large Language Model-Assisted UAV Operations and Communications: A Multifaceted Survey and Tutorial
무인 항공기(UAV)는 이동성과 민첩성을 바탕으로 다양한 분야에서 널리 활용되고 있습니다. 최근 대규모 언어 모델(LLM)의 발전은 기존의 최적화 기반 및 학습 기반 접근 방식을 넘어 UAV의 지능을 향상시키는 혁신적인 기회를 제공합니다. LLM을 UAV 시스템에 통합함으로써, 고급 환경 이해, 군집 조정, 이동성 최적화 및 고수준 작업 추론이 가능하며, 이를 통해 더욱 적응적이고 상황 인지적인 항공 운영이 가능합니다. 본 연구는 LLM과 UAV 기술의 융합을 체계적으로 탐구하고, 기존의 아키텍처, 방법론 및 UAV 응용 분야를 통합하는 통일된 프레임워크를 제시합니다. 먼저, 사전 훈련, 미세 조정, 검색 증강 생성(RAG) 및 프롬프트 엔지니어링과 같은 UAV를 위한 LLM 적용 기술의 체계적인 분류를 제시하며, 체인 오브 씽킹(CoT) 및 인 컨텍스트 학습(ICL)과 같은 핵심 추론 능력을 함께 다룹니다. 다음으로, LLM 기반의 UAV 통신 및 운영, 즉 항법, 임무 계획, 군집 제어, 안전, 자율성 및 네트워크 관리에 대한 내용을 검토합니다. 또한, 본 연구는 다중 모드 LLM(MLLM)을 활용한 인간-군집 상호 작용, 인식 기반 항법 및 협업 제어에 대해 논의합니다. 마지막으로, 편향, 투명성, 책임성 및 인간 개입(HITL) 전략과 같은 윤리적 고려 사항을 다루고, 향후 연구 방향을 제시합니다. 전반적으로, 본 연구는 LLM 기반의 UAV를 지능적이고 적응적인 항공 시스템의 기반으로 제시합니다.
Uncrewed Aerial Vehicles (UAVs) are widely deployed across diverse applications due to their mobility and agility. Recent advances in Large Language Models (LLMs) offer a transformative opportunity to enhance UAV intelligence beyond conventional optimization-based and learning-based approaches. By integrating LLMs into UAV systems, advanced environmental understanding, swarm coordination, mobility optimization, and high-level task reasoning can be achieved, thereby allowing more adaptive and context-aware aerial operations. This survey systematically explores the intersection of LLMs and UAV technologies and proposes a unified framework that consolidates existing architectures, methodologies, and applications for UAVs. We first present a structured taxonomy of LLM adaptation techniques for UAVs, including pretraining, fine-tuning, Retrieval-Augmented Generation (RAG), and prompt engineering, along with key reasoning capabilities such as Chain-of-Thought (CoT) and In-Context Learning (ICL). We then examine LLM-assisted UAV communications and operations, covering navigation, mission planning, swarm control, safety, autonomy, and network management. After that, the survey further discusses Multimodal LLMs (MLLMs) for human-swarm interaction, perception-driven navigation, and collaborative control. Finally, we address ethical considerations, including bias, transparency, accountability, and Human-in-the-Loop (HITL) strategies, and outline future research directions. Overall, this work positions LLM-assisted UAVs as a foundation for intelligent and adaptive aerial systems.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.