2603.16365v1 Mar 17, 2026 cs.AI

FactorEngine: 프로그램 수준의 지식 기반 팩터 마이닝 프레임워크를 이용한 양적 투자

FactorEngine: A Program-level Knowledge-Infused Factor Mining Framework for Quantitative Investment

Wei Wang
Wei Wang
Citations: 0
h-index: 0
Yukun Chen
Yukun Chen
Citations: 239
h-index: 9
Qinhong Lin
Qinhong Lin
Citations: 12
h-index: 2
Ruitao Feng
Ruitao Feng
Citations: 1
h-index: 1
Yinglun Feng
Yinglun Feng
Citations: 7
h-index: 1
Zhongliang Yang
Zhongliang Yang
Citations: 7
h-index: 1
Binjie Fei
Binjie Fei
Citations: 6
h-index: 1
Jiaqi Liu
Jiaqi Liu
Citations: 6
h-index: 1

본 연구는 노이즈가 많고 비정상적인 시장 데이터에서 예측 신호를 자동으로 발견하는 알파 팩터 마이닝을 다룬다. 이때, 발견된 팩터는 직접 실행 가능하고 감사 가능해야 하며, 대규모에서도 계산적으로 효율적이어야 한다. 기존의 기호 기반 접근 방식은 표현력에 한계가 있으며, 신경망 예측 모델은 해석 가능성을 성능으로 대체하는 경향이 있고, 시장 환경 변화에 취약하며 과적합될 위험이 있다. 본 연구에서는 프로그램 수준의 팩터 발견 프레임워크인 FactorEngine (FE)을 제안한다. FE는 팩터를 튜링 완전한 코드로 표현하며, 다음과 같은 세 가지 분리 방식을 통해 효과성과 효율성을 향상시킨다: (i) 논리 수정과 파라미터 최적화의 분리, (ii) LLM 기반의 방향성 탐색과 베이지안 하이퍼파라미터 탐색의 분리, (iii) LLM 활용과 로컬 계산의 분리. 또한, FE는 비정형 금융 보고서를 실행 가능한 팩터 프로그램으로 변환하는 폐루프 멀티 에이전트 추출-검증-코드 생성 파이프라인을 포함하는 지식 기반 부팅 모듈과, 실패로부터 학습을 포함하는 경로 인식 개선을 지원하는 경험 지식 베이스를 통합한다. 실제 OHLCV 데이터를 이용한 광범위한 백테스팅 결과, FE는 기준 방법보다 예측 안정성과 포트폴리오 영향력이 훨씬 더 우수한 팩터를 생성한다. 예를 들어, IC/ICIR (및 순위 IC/ICIR)이 높고 AR/Sharpe 비율이 개선되어, 최첨단 수준의 예측 및 포트폴리오 성능을 달성한다.

Original Abstract

We study alpha factor mining, the automated discovery of predictive signals from noisy, non-stationary market data-under a practical requirement that mined factors be directly executable and auditable, and that the discovery process remain computationally tractable at scale. Existing symbolic approaches are limited by bounded expressiveness, while neural forecasters often trade interpretability for performance and remain vulnerable to regime shifts and overfitting. We introduce FactorEngine (FE), a program-level factor discovery framework that casts factors as Turing-complete code and improves both effectiveness and efficiency via three separations: (i) logic revision vs. parameter optimization, (ii) LLM-guided directional search vs. Bayesian hyperparameter search, and (iii) LLM usage vs. local computation. FE further incorporates a knowledge-infused bootstrapping module that transforms unstructured financial reports into executable factor programs through a closed-loop multi-agent extraction-verification-code-generation pipeline, and an experience knowledge base that supports trajectory-aware refinement (including learning from failures). Across extensive backtests on real-world OHLCV data, FE produces factors with substantially stronger predictive stability and portfolio impact-for example, higher IC/ICIR (and Rank IC/ICIR) and improved AR/Sharpe, than baseline methods, achieving state-of-the-art predictive and portfolio performance.

0 Citations
0 Influential
4.5 Altmetric
22.5 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!