타일 매칭을 넘어: 비전 기반의 UAV 항법을 위한 비정렬 항공 및 위성 이미지 연결
Beyond Matching to Tiles: Bridging Unaligned Aerial and Satellite Views for Vision-Only UAV Navigation
최근의 교차 시점 지리 위치 결정(CVGL) 방법은 GNSS 신호가 제한적인 환경에서 무인 항공기(UAV) 항법을 지원하는 데 강력한 잠재력을 보여주고 있습니다. 그러나 기존 연구는 주로 UAV 시야를 탑재된 지도 타일에 매칭하는 데 초점을 맞추는데, 이는 정확성과 저장 공간의 균형이라는 고유한 제약을 초래하며, UAV 항법 중 중요한 요소인 UAV의 방향을 간과합니다. 또한, 교차 시나리오에서 발생하는 상당한 차이와 다양한 중복성은 충분히 고려되지 않았으며, 이는 실제 환경으로의 일반화 능력을 제한합니다. 본 논문에서는 인접한 특징으로부터 UAV의 절대 위치와 방향을 동시에 예측하여 정확하고, 가벼우며, 강력한 야외 항법을 가능하게 하는 순수 비전 기반의 교차 시점 항법 방법인 Bearing-UAV를 제시합니다. 우리의 방법은 글로벌 및 로컬 구조적 특징을 활용하고, 상대적인 공간 관계를 명시적으로 인코딩하여 교차 시점 변화, 불일치 및 특징이 부족한 조건에 강건합니다. 또한, 교차 시점 위치 결정 및 항법 성능을 평가하기 위한 다도시 벤치마크인 Bearing-UAV-90k를 제시합니다. 광범위한 실험 결과는 Bearing-UAV가 다양한 지형에서 이전의 매칭/검색 방식보다 낮은 위치 결정 오류를 제공한다는 긍정적인 결과를 보여줍니다. 우리의 코드와 데이터셋은 공개적으로 제공될 예정입니다.
Recent advances in cross-view geo-localization (CVGL) methods have shown strong potential for supporting unmanned aerial vehicle (UAV) navigation in GNSS-denied environments. However, existing work predominantly focuses on matching UAV views to onboard map tiles, which introduces an inherent trade-off between accuracy and storage overhead, and overlooks the importance of the UAV's heading during navigation. Moreover, the substantial discrepancies and varying overlaps in cross-view scenarios have been insufficiently considered, limiting their generalization to real-world scenarios. In this paper, we present Bearing-UAV, a purely vision-driven cross-view navigation method that jointly predicts UAV absolute location and heading from neighboring features, enabling accurate, lightweight, and robust navigation in the wild. Our method leverages global and local structural features and explicitly encodes relative spatial relationships, making it robust to cross-view variations, misalignment, and feature-sparse conditions. We also present Bearing-UAV-90k, a multi-city benchmark for evaluating cross-view localization and navigation. Extensive experiments show encouraging results that Bearing-UAV yields lower localization error than previous matching/retrieval paradigm across diverse terrains. Our code and dataset will be made publicly available.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.