코변레이트 시계열 데이터 기반 검색 증강 생성 모델
Retrieval-Augmented Generation with Covariate Time Series
검색 증강 생성(RAG)은 LLM의 성능을 크게 향상시켰지만, 이 패러다임을 시계열 기반 모델(TSFM)로 확장하는 것은 여전히 어려운 과제입니다. 특히, 압력 조절 및 차단 밸브(PRSOV)의 예측 유지보수와 같은 고위험 산업 환경에서 데이터 부족, 짧은 시퀀스, 그리고 코변레이트 결합된 동역학적 특성으로 인해 어려움이 발생합니다. 기존의 시계열 RAG 방법은 주로 정적 벡터 임베딩과 학습 가능한 컨텍스트 증강기를 사용하는데, 이러한 방식은 데이터가 부족하고, 시퀀스가 짧으며, 코변레이트가 결합된 시나리오에서 유사한 상태를 구별하는 데 어려움을 겪을 수 있습니다. 이러한 한계점을 극복하기 위해, 우리는 코변레이트 시계열 데이터에 특화된, 학습이 필요 없는 RAG 프레임워크인 RAG4CTS를 제안합니다. 구체적으로, 우리는 계층적인 시계열 기반 지식 베이스를 구축하여 원시 역사 데이터를 손실 없이 저장하고, 물리학 기반의 검색을 가능하게 합니다. 또한, 포인트별 및 다변량 유사성을 활용한 2단계 가중 검색 메커니즘을 설계하여 과거 추세를 정렬합니다. 컨텍스트 증강을 위해, 우리는 자체적으로 컨텍스트를 최적화하는 에이전트 기반 전략을 도입했습니다. PRSOV 데이터에 대한 광범위한 실험 결과, 제안하는 프레임워크가 예측 정확도 측면에서 최첨단 기준 모델보다 훨씬 우수한 성능을 보였습니다. 제안하는 시스템은 중국 남방 항공의 Apache IoTDB에 배포되었으며, 배포 이후 2개월 동안 오탐 없이 PRSOV의 결함 1건을 성공적으로 식별했습니다.
While RAG has greatly enhanced LLMs, extending this paradigm to Time-Series Foundation Models (TSFMs) remains a challenge. This is exemplified in the Predictive Maintenance of the Pressure Regulating and Shut-Off Valve (PRSOV), a high-stakes industrial scenario characterized by (1) data scarcity, (2) short transient sequences, and (3) covariate coupled dynamics. Unfortunately, existing time-series RAG approaches predominantly rely on generated static vector embeddings and learnable context augmenters, which may fail to distinguish similar regimes in such scarce, transient, and covariate coupled scenarios. To address these limitations, we propose RAG4CTS, a regime-aware, training-free RAG framework for Covariate Time-Series. Specifically, we construct a hierarchal time-series native knowledge base to enable lossless storage and physics-informed retrieval of raw historical regimes. We design a two-stage bi-weighted retrieval mechanism that aligns historical trends through point-wise and multivariate similarities. For context augmentation, we introduce an agent-driven strategy to dynamically optimize context in a self-supervised manner. Extensive experiments on PRSOV demonstrate that our framework significantly outperforms state-of-the-art baselines in prediction accuracy. The proposed system is deployed in Apache IoTDB within China Southern Airlines. Since deployment, our method has successfully identified one PRSOV fault in two months with zero false alarm.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.