FinSTaR: 시계열 추론 모델을 활용한 금융 추론 연구
FinSTaR: Towards Financial Reasoning with Time Series Reasoning Models
시계열 추론 모델(TSRM)은 일반적인 영역에서 유망한 성능을 보여주었지만, 고유한 특징을 갖는 금융 분야에서는 지속적으로 어려움을 겪고 있습니다. 본 논문에서는 단일 개체 분석과 다중 개체 분석, 그리고 현재 상태 평가와 미래 행동 예측이라는 두 가지 측면을 결합하여 TSRM의 일반적인 2x2 기능 분류 체계를 제안합니다. 우리는 이 분류 체계를 금융 분야에 적용하여, 결정론적 평가와 확률적 예측 간의 구분이 특히 중요한 금융 추론 과제 10개를 정의하고, S&P 주식을 기반으로 하는 FinTSR-Bench 벤치마크를 구성합니다. 이를 위해 우리는 FinTSR-Bench 데이터셋으로 학습된 FinSTaR(Financial Time Series Thinking and Reasoning) 모델을 제안합니다. FinSTaR은 각 범주에 특화된 다양한 체인 오브 씽크(CoT) 전략을 사용합니다. 결정론적인 평가(관측 가능한 데이터로부터 계산 가능한 경우)의 경우, 모델이 원시 가격 데이터로부터 직접 답변을 도출할 수 있도록 하는 프로그래밍 방식의 CoT인 Compute-in-CoT를 사용합니다. 확률적인 예측(본질적으로 관측할 수 없는 요인에 영향을 받는 경우)의 경우, 모델이 판단을 내리기 전에 다양한 시나리오를 생성하여 금융 분석가가 불확실성 하에서 추론하는 방식을 반영하는 Scenario-Aware CoT를 채택합니다. 제안된 방법은 FinTSR-Bench에서 평균 78.9%의 정확도를 달성하여 기존 LLM 및 TSRM의 성능을 크게 능가합니다. 또한, 네 가지 기능 범주가 상호 보완적이며 공동 학습을 통해 서로 강화되는 것을 보여주었으며, Scenario-Aware CoT가 표준 CoT보다 예측 정확도를 꾸준히 향상시키는 것을 확인했습니다. 코드 및 관련 자료는 다음 주소에서 공개적으로 이용할 수 있습니다: https://github.com/seunghan96/FinSTaR.
Time series (TS) reasoning models (TSRMs) have shown promising capabilities in general domains, yet they consistently fail on financial domain, which exhibit unique characteristics. We propose a general 2x2 capability taxonomy for TSRMs by crossing 1) single-entity vs. multi-entity analysis with 2) assessment of the current state vs. prediction of future behavior. We instantiate this taxonomy in the financial domain -- where the distinction between deterministic assessment and stochastic prediction is particularly critical -- as ten financial reasoning tasks, forming the FinTSR-Bench benchmark based on S&P stocks. To this end, we propose FinSTaR (Financial Time Series Thinking and Reasoning), trained on FinTSR-Bench with distinct chain-of-thought (CoT) strategies tailored to each category. For assessment, which is deterministic (i.e., computable from observable data), we employ Compute-in-CoT, a programmatic CoT that enables models to derive answers directly from raw prices. For prediction, which is inherently stochastic (i.e., subject to unobservable factors), we adopt Scenario-Aware CoT, which generates diverse scenarios before making a judgment, mirroring how financial analysts reason under uncertainty. The proposed method achieves 78.9% average accuracy on FinTSR-Bench, substantially outperforming LLM and TSRM baselines. Furthermore, we show that the four capability categories are complementary and mutually reinforcing through joint training, and that Scenario-Aware CoT consistently improves prediction accuracy over standard CoT. Code is publicly available at: https://github.com/seunghan96/FinSTaR.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.