2602.12617v1 Feb 13, 2026 cs.AI

GeoAgent: 강화된 지리적 특성을 활용한 전역 위치 추정 학습

GeoAgent: Learning to Geolocate Everywhere with Reinforced Geographic Characteristics

Modi Jin
Modi Jin
Citations: 13
h-index: 2
Ming-Ming Cheng
Ming-Ming Cheng
Citations: 548
h-index: 11
Qibin Hou
Qibin Hou
Citations: 40
h-index: 3
Yiming Zhang
Yiming Zhang
Citations: 51
h-index: 3
Boyuan Sun
Boyuan Sun
Citations: 135
h-index: 7
Dingwen Zhang
Dingwen Zhang
Citations: 32
h-index: 3

본 논문에서는 인간과 유사한 수준으로 추론하고 세밀한(fine-grained) 주소 결과를 도출할 수 있는 모델인 GeoAgent를 제안한다. 기존의 강화 학습(RL) 기반 방법들은 성능과 해석 가능성 면에서 획기적인 발전을 이루었으나, AI가 생성한 생각의 사슬(CoT) 데이터에 대한 의존성과 지리적 특성과 상충되는 훈련 전략으로 인해 여전히 우려가 남아 있다. 이러한 문제를 해결하기 위해, 우리는 먼저 지리 전문가와 전문 플레이어들이 주석을 단 CoT 데이터로 구성된 새로운 위치 추정 데이터셋인 GeoSeek을 소개한다. 더 나아가 지리적 작업의 고유한 특성을 철저히 탐구하고, 훈련을 보조하기 위해 지리적 유사성 보상과 일관성 에이전트가 평가하는 일관성 보상을 제안한다. 이는 모델이 추론 과정의 무결성과 일관성을 보장하면서 지리적 관점에서 정답으로 수렴하도록 유도한다. 실험 결과, GeoAgent는 인간과 매우 유사한 추론을 생성하면서도 여러 입도(grain)에 걸쳐 기존 방법 및 다양한 일반 시각 거대 언어 모델(VLLM)들을 능가하는 성능을 보이는 것으로 나타났다.

Original Abstract

This paper presents GeoAgent, a model capable of reasoning closely with humans and deriving fine-grained address conclusions. Previous RL-based methods have achieved breakthroughs in performance and interpretability but still remain concerns because of their reliance on AI-generated chain-of-thought (CoT) data and training strategies, which conflict with geographic characteristics. To address these issues, we first introduce GeoSeek, a new geolocation dataset comprising CoT data annotated by geographic experts and professional players. We further thoroughly explore the inherent characteristics of geographic tasks and propose a geo-similarity reward and a consistency reward assessed by a consistency agent to assist training. This encourages the model to converge towards correct answers from a geographic perspective while ensuring the integrity and consistency of its reasoning process. Experimental results show that GeoAgent outperforms existing methods and a series of general VLLMs across multiple grains, while generating reasoning that closely aligns with humans.

3 Citations
0 Influential
5.5 Altmetric
30.5 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!