2602.02559v1 Jan 30, 2026 cs.AI

경험 기반 다중 에이전트 시스템: 학습 없이 문맥 인지 지구 관찰 시스템

Experience-Driven Multi-Agent Systems Are Training-free Context-aware Earth Observers

Yafei Ou
Yafei Ou
Citations: 121
h-index: 7
Pengyu Dai
Pengyu Dai
Citations: 33
h-index: 3
Weihao Xuan
Weihao Xuan
Citations: 462
h-index: 12
Junjue Wang
Junjue Wang
Citations: 191
h-index: 6
Hongruixuan Chen
Hongruixuan Chen
Citations: 1,971
h-index: 19
Jian Song
Jian Song
RIKEN AIP
Citations: 585
h-index: 11
Naoto Yokoya
Naoto Yokoya
Citations: 139
h-index: 6

최근의 발전으로 인해, 대규모 언어 모델(LLM) 에이전트는 외부 도구를 활용하여 복잡한 작업을 수행할 수 있게 되었습니다. 그러나 이러한 에이전트는 장기적인 실행, 다양한 모달리티 간의 긴밀한 조정, 그리고 암묵적인 도구 제약 조건을 요구하는 특수한 도구 중심 영역에서 어려움을 겪는 경우가 많습니다. 지구 관측(EO) 작업은 다중 모달 및 다중 시간 데이터 입력, 그리고 지리 정보 제약 조건(스펙트럼 라이브러리, 공간 추론 등)의 요구 사항으로 인해 이러한 어려움을 잘 보여주는 예시입니다. 많은 고수준 계획이 파이프라인을 통해 전파되어 최종 결과에 영향을 미치는 미묘한 실행 오류로 인해 실패할 수 있습니다. 핵심적인 어려움은 기존 에이전트가 상호 작용을 통해 도구 수준의 세밀한 전문 지식을 학습할 수 있는 메커니즘이 부족하다는 점입니다. 이러한 전문 지식이 없으면 에이전트는 도구 파라미터를 안정적으로 구성하거나 실행 중 발생하는 오류로부터 복구할 수 없으며, 이는 복잡한 EO 워크플로우에서 효과성을 제한합니다. 이러한 문제를 해결하기 위해, 우리는 LLM 에이전트가 파라미터 업데이트 없이 구조화된 상호 작용을 통해 EO 전문 지식을 습득할 수 있도록 하는 자체 진화형 다중 에이전트 시스템(MAS)인 GeoEvolver를 소개합니다. GeoEvolver는 검색 증강 다중 에이전트 오케스트레이터를 사용하여 각 쿼리를 독립적인 하위 목표로 분해하고, 하위 목표 수준에서 다양한 도구 파라미터 구성을 탐색합니다. 성공적인 패턴과 실패 원인 분석 결과는 지속적으로 업데이트되는 메모리 뱅크에 저장되며, 이는 향후 쿼리에 대한 컨텍스트 내 데모를 제공합니다. 세 가지 도구 통합 EO 벤치마크에 대한 실험 결과, GeoEvolver는 여러 LLM 아키텍처에서 평균 12%의 성능 향상을 보이며, 전체 작업 성공률을 꾸준히 향상시켰습니다. 이는 효율적이고 세밀한 환경과의 상호 작용을 통해 EO 전문 지식이 점진적으로 발전할 수 있음을 보여줍니다.

Original Abstract

Recent advances have enabled large language model (LLM) agents to solve complex tasks by orchestrating external tools. However, these agents often struggle in specialized, tool-intensive domains that demand long-horizon execution, tight coordination across modalities, and strict adherence to implicit tool constraints. Earth Observation (EO) tasks exemplify this challenge due to the multi-modal and multi-temporal data inputs, as well as the requirements of geo-knowledge constraints (spectrum library, spatial reasoning, etc): many high-level plans can be derailed by subtle execution errors that propagate through a pipeline and invalidate final results. A core difficulty is that existing agents lack a mechanism to learn fine-grained, tool-level expertise from interaction. Without such expertise, they cannot reliably configure tool parameters or recover from mid-execution failures, limiting their effectiveness in complex EO workflows. To address this, we introduce \textbf{GeoEvolver}, a self-evolving multi-agent system~(MAS) that enables LLM agents to acquire EO expertise through structured interaction without any parameter updates. GeoEvolver decomposes each query into independent sub-goals via a retrieval-augmented multi-agent orchestrator, then explores diverse tool-parameter configurations at the sub-goal level. Successful patterns and root-cause attribution from failures are then distilled in an evolving memory bank that provides in-context demonstrations for future queries. Experiments on three tool-integrated EO benchmarks show that GeoEvolver consistently improves end-to-end task success, with an average gain of 12\% across multiple LLM backbones, demonstrating that EO expertise can emerge progressively from efficient, fine-grained interactions with the environment.

0 Citations
0 Influential
9.5 Altmetric
47.5 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!