TimeTok: 계층적 토큰화를 통한 세분성 제어 가능한 시계열 생성
TimeTok: Granularity-Controllable Time-Series Generation via Hierarchical Tokenization
시계열 생성 모델은 종종 시간적 세분성에 대한 제어 기능을 제공하지 못하여 사용자가 모델이 생성하는 세분성을 그대로 수용해야 하는 경우가 많습니다. 사용자가 주도적으로 시계열을 생성할 수 있도록, 우리는 시간적 세분성 제어를 가능하게 하는 통합 프레임워크인 TimeTok을 제안합니다. TimeTok은 임의의 세분성 수준으로 시계열을 생성하며, 이는 더 낮은 세분성 수준의 입력 데이터(예: 개략적인 스케치) 또는 완전히 새로운 데이터로부터 시작할 수 있습니다. TimeTok의 핵심은 시계열을 거친 것부터 세밀한 것까지의 시간적 세분성 순서로 토큰 시퀀스로 매핑하는 계층적 토큰화 전략입니다. 우리의 자기 회귀 생성 과정은 이러한 세분성 수준에서 작동하며, 토큰 블록을 생성하여 이를 연속적인 시계열로 디코딩합니다. 이러한 설계는 표준 생성 방식을 포함한 시간적 세분성 제어를 하나의 프레임워크 내에서 가능하게 하며, 생성되는 토큰 블록의 수를 조절함으로써 출력의 상세 정도를 명시적으로 제어할 수 있습니다. 실험 결과, TimeTok은 시간적 세분성 제어 작업에서 뛰어난 성능을 보이며, 표준 생성 작업에서도 최첨단 성능을 달성했습니다. 또한, 우리는 다양한 시간적 세분성을 가진 여러 데이터셋으로 학습하여 TimeTok의 잠재력을 보여주었으며, 이는 개별 데이터셋으로 학습된 모델보다 일관되게 우수한 성능을 보이는 전이 학습 능력을 입증합니다. 우리가 알고 있는 한, TimeTok은 시계열 생성의 모든 영역을 포괄하는 첫 번째 통합 프레임워크이며, 다양한 시간적 세분성으로부터 이점을 얻는 모델에게 귀중한 기반을 제공합니다.
Time-series generative models often lack control over temporal granularity, forcing users to accept whatever granularity the model produces. To enable truly user-driven generation, we introduce TimeTok, a unified framework for Granularity-Controllable Time-Series Generation (GC-TSG), which generates time series at any target granularity from any coarser input (e.g., rough sketches) or from scratch. At the core of TimeTok is a hierarchical tokenization strategy that maps time series into an ordered sequence of tokens, from coarse to fine temporal granularity. Our autoregressive generation process operates across these granularity levels, producing token blocks that are decoded back into continuous time series. This design naturally enables GC-TSG - including standard generation - within a single framework, where controlling the number of token blocks provides explicit control over output detail. Experiments show that TimeTok excels at GC-TSG tasks while achieving state-of-the-art performance in standard generation. Furthermore, we showcase TimeTok's potential as a foundational tokenizer by training on multiple datasets with heterogeneous temporal granularities, verifying strong transferability that consistently outperforms models trained on individual datasets. To our knowledge, this is the first unified framework that covers the full generative spectrum for time series, offering a valuable foundation for models that benefit from diverse temporal granularities.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.