CastFlow: 역할 특화된 에이전트 기반 시계열 예측 워크플로우 학습
CastFlow: Learning Role-Specialized Agentic Workflows for Time Series Forecasting
최근, 대규모 언어 모델(LLM)은 시계열 예측 분야에서 큰 잠재력을 보여주고 있습니다. 그러나 대부분의 기존 LLM 기반 예측 방법은 여전히 정적인 생성 패러다임을 따르며, 이는 과거 관측값을 단일 단계로 미래 값에 매핑합니다. 이러한 패러다임은 제한적인 시간 패턴 추출, 단일 라운드의 컨텍스트 특징 획득, 일회성 예측 생성, 그리고 앙상블 예측 지원 부족과 같은 제약을 초래합니다. 이러한 한계를 극복하기 위해, 본 연구에서는 다각적인 시간 패턴 추출, 다중 라운드의 컨텍스트 특징 획득, 반복적인 예측 개선, 그리고 앙상블 예측을 지원하는 동적인 에이전트 기반 예측 프레임워크인 CastFlow를 제안합니다. 첫째, CastFlow는 예측 과정을 계획, 실행, 예측, 그리고 성찰의 단계로 구성하여 에이전트 기반 워크플로우를 구축합니다. 둘째, 이 워크플로우는 과거 경험을 검색하는 메모리 모듈과 진단 증거를 구성하고 신뢰할 수 있는 앙상블 예측 기준을 제공하는 다각적 도구 키트를 통해 지원됩니다. 셋째, CastFlow는 일반적인 추론 능력과 특화된 수치 예측 능력을 결합한 역할 특화된 설계를 채택합니다. 이러한 설계 하에서, 고정된 LLM은 일반적인 추론 능력을 유지하는 반면, 미세 조정된 도메인 특화 LLM은 앙상블 예측 기준을 기반으로 증거 기반의 수치 예측을 수행하며, 처음부터 예측을 수행하지 않습니다. 미세 조정된 도메인 특화 LLM을 최적화하기 위해, 우리는 지도 학습(SFT)과 검증 가능한 보상(RLVR)을 활용한 두 단계의 워크플로우 기반 학습 방법을 추가로 개발했습니다. CastFlow의 효과성을 평가하기 위해, 다양한 데이터 세트에서 광범위한 실험을 수행했으며, 강력한 기준 모델에 비해 우수한 전반적인 결과를 달성했음을 보여주었습니다. 본 연구가 더욱 적응적이고 정확한 시계열 예측을 향한 발판이 되기를 바랍니다.
Recently, large language models (LLMs) have shown great promise in time series forecasting. However, most existing LLM-based forecasting methods still follow a static generative paradigm that directly maps historical observations to future values in a single pass. Under this paradigm, forecasting is constrained by limited temporal pattern extraction, single-round acquisition of contextual features, one-shot forecast generation, and lack of support from ensemble forecasts. To address these limitations, in this work, we propose CastFlow, a dynamic agentic forecasting framework that enables multi-view temporal pattern extraction, multi-round contextual features acquisition, iterative forecast refinement, and forecasting with ensemble forecasts. First, CastFlow organizes the forecasting process into planning, action, forecasting, and reflection, establishing an agentic workflow. Second, this workflow is supported by a memory module that retrieves prior experience and a multi-view toolkit that constructs diagnostic evidence and provides a reliable ensemble forecast baseline. Third, CastFlow adopts a role-specialized design that combines general-purpose reasoning with specialized numerical forecasting. Under this design, a frozen LLM preserves general-purpose reasoning, while a fine-tuned domain-specific LLM performs evidence-guided numerical forecasting based on the ensemble forecast baseline, rather than from scratch. To optimize a fine-tuned domain-specific LLM, we further develop a two-stage workflow-oriented training that combines supervised fine-tuning (SFT) and reinforcement learning with verifiable rewards (RLVR). To evaluate the effectiveness of CastFlow, we conduct extensive experiments on diverse datasets and show that it achieves superior overall results against strong baselines. We hope that this work can serve as a step toward more adaptive and accurate time series forecasting.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.