다중 에이전트 시스템을 활용한 시계열 시각적 추론
Visual Reasoning over Time Series via Multi-Agent System
시계열 분석은 많은 실제 응용 분야의 기반이 되지만, 기존의 시계열 특화 방법론과 사전 학습된 대규모 모델 기반 접근법은 직관적인 시각적 추론을 통합하고 적응형 도구 사용을 통해 태스크 전반에 걸쳐 일반화하는 데 여전히 한계가 있습니다. 이러한 한계를 해결하기 위해, 우리는 에이전트 간 통신, 시각적 추론, 잠재 재구성을 통합된 프레임워크 내에서 결합하는 '분석가-추론가-실행가(Analyzer-Reasoner-Executor)' 패러다임을 기반으로 구축된, 범용 시계열 작업을 위한 도구 주도형 다중 에이전트 시스템인 MAS4TS를 제안합니다. MAS4TS는 먼저 시각-언어 모델(Vision-Language Model)을 사용하여 구조적 사전 정보(priors)가 포함된 시계열 플롯에 대해 시각적 추론을 수행함으로써 시간적 구조를 추출하고, 이후 잠재 공간(latent space)에서 예측 궤적을 재구성합니다. 세 개의 전문화된 에이전트가 공유 메모리와 게이트 통신을 통해 협력하며, 라우터는 실행을 위해 작업별 도구 체인을 선택합니다. 여러 벤치마크에 대한 광범위한 실험 결과, MAS4TS는 다양한 시계열 작업 전반에서 최고 수준(state-of-the-art)의 성능을 달성하는 동시에 강력한 일반화 능력과 효율적인 추론 성능을 입증했습니다.
Time series analysis underpins many real-world applications, yet existing time-series-specific methods and pretrained large-model-based approaches remain limited in integrating intuitive visual reasoning and generalizing across tasks with adaptive tool usage. To address these limitations, we propose MAS4TS, a tool-driven multi-agent system for general time series tasks, built upon an Analyzer-Reasoner-Executor paradigm that integrates agent communication, visual reasoning, and latent reconstruction within a unified framework. MAS4TS first performs visual reasoning over time series plots with structured priors using a Vision-Language Model to extract temporal structures, and subsequently reconstructs predictive trajectories in latent space. Three specialized agents coordinate via shared memory and gated communication, while a router selects task-specific tool chains for execution. Extensive experiments on multiple benchmarks demonstrate that MAS4TS achieves state-of-the-art performance across a wide range of time series tasks, while exhibiting strong generalization and efficient inference.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.