Sonar-TS: 시계열 데이터베이스를 위한 검색 후 검증 기반 자연어 질의
Sonar-TS: Search-Then-Verify Natural Language Querying for Time Series Databases
시계열 데이터베이스를 위한 자연어 질의(NLQ4TSDB)는 비전문가 사용자가 방대한 시간 기록에서 의미 있는 이벤트, 구간 및 요약을 검색할 수 있도록 지원하는 것을 목표로 한다. 그러나 기존의 Text-to-SQL 방법들은 형태나 이상치와 같은 연속적인 형태론적 의도를 처리하도록 설계되지 않았으며, 시계열 모델들은 초장기 과거 데이터 기록을 처리하는 데 어려움을 겪는다. 이러한 문제를 해결하기 위해, 우리는 검색 후 검증(Search-Then-Verify) 파이프라인을 통해 NLQ4TSDB를 해결하는 신경 기호(neuro-symbolic) 프레임워크인 Sonar-TS를 제안한다. 능동 소나(active sonar)와 유사하게, 이는 특징 인덱스를 활용하여 SQL을 통해 후보 윈도우를 탐색(ping)한 다음, 생성된 파이썬 프로그램을 사용하여 원시 신호에 대해 후보를 포착(lock on)하고 검증한다. 효과적인 평가를 가능하게 하기 위해, 우리는 TSDB 규모의 기록에 대한 자연어 질의(NLQ)를 위해 설계된 최초의 대규모 벤치마크인 NLQTSBench를 소개한다. 우리의 실험은 이 도메인 내의 고유한 과제들을 강조하고, 기존 방법들이 실패하는 복잡한 시간적 질의를 Sonar-TS가 효과적으로 처리함을 보여준다. 이 연구는 NLQ4TSDB에 대한 최초의 체계적인 연구를 제시하며, 향후 연구를 촉진하기 위한 일반적인 프레임워크와 평가 표준을 제공한다.
Natural Language Querying for Time Series Databases (NLQ4TSDB) aims to assist non-expert users retrieve meaningful events, intervals, and summaries from massive temporal records. However, existing Text-to-SQL methods are not designed for continuous morphological intents such as shapes or anomalies, while time series models struggle to handle ultra-long histories. To address these challenges, we propose Sonar-TS, a neuro-symbolic framework that tackles NLQ4TSDB via a Search-Then-Verify pipeline. Analogous to active sonar, it utilizes a feature index to ping candidate windows via SQL, followed by generated Python programs to lock on and verify candidates against raw signals. To enable effective evaluation, we introduce NLQTSBench, the first large-scale benchmark designed for NLQ over TSDB-scale histories. Our experiments highlight the unique challenges within this domain and demonstrate that Sonar-TS effectively navigates complex temporal queries where traditional methods fail. This work presents the first systematic study of NLQ4TSDB, offering a general framework and evaluation standard to facilitate future research.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.