LLaTiSA: 시각적 인식에서 의미론에 이르기까지, 난이도 계층화된 시계열 추론
LLaTiSA: Towards Difficulty-Stratified Time Series Reasoning from Visual Perception to Semantics
시계열 데이터에 대한 포괄적인 이해는 대규모 언어 모델(LLM)에게 여전히 중요한 과제입니다. 현재 연구는 단편적인 작업 정의와 내재적인 모호성을 가진 벤치마크로 인해 어려움을 겪고 있으며, 이는 엄격한 평가와 통합된 시계열 추론 모델(TSRM) 개발을 방해합니다. 이러한 격차를 해소하기 위해, 우리는 인지적 복잡성이 증가하는 4단계 분류 체계를 통해 시계열 추론(TSR)을 공식화합니다. 우리는 83,000개의 샘플로 구성된 계층적 시계열 추론 데이터셋인 HiTSR을 소개하며, 이 데이터셋은 다양한 작업 조합과 검증된 연쇄적 사고(CoT) 경로를 포함합니다. HiTSR을 활용하여, 우리는 시각화된 패턴과 정밀하게 조정된 수치 테이블을 통합하여 시각-언어 모델(VLM)의 시간적 인식을 향상시키는 강력한 TSRM인 LLaTiSA를 제안합니다. 다단계 커리큘럼 미세 조정 전략을 통해 LLaTiSA는 다양한 TSR 작업 및 실제 시나리오에서 뛰어난 성능을 달성하며, 강력한 일반화 능력을 보여줍니다. 저희의 코드는 https://github.com/RainingNovember/LLaTiSA 에서 확인할 수 있습니다.
Comprehensive understanding of time series remains a significant challenge for Large Language Models (LLMs). Current research is hindered by fragmented task definitions and benchmarks with inherent ambiguities, precluding rigorous evaluation and the development of unified Time Series Reasoning Models(TSRMs). To bridge this gap, we formalize Time Series Reasoning (TSR) via a four-level taxonomy of increasing cognitive complexity. We introduce HiTSR, a hierarchical time series reasoning dataset comprising 83k samples with diverse task combinations and verified Chain-of-Thought (CoT) trajectories. Leveraging HiTSR, we propose LLaTiSA, a strong TSRM that integrates visualized patterns with precision-calibrated numerical tables to enhance the temporal perception of Vision-Language Models (VLMs). Through a multi-stage curriculum fine-tuning strategy, LLaTiSA achieves superior performance and exhibits robust out-of-distribution generalization across diverse TSR tasks and real-world scenarios. Our code is available at https://github.com/RainingNovember/LLaTiSA.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.