전국 의료 청구 데이터를 활용한 실증적 근거를 확보하기 위한 기반 모델
Foundation Models to Unlock Real-World Evidence from Nationwide Medical Claims
대규모 실증 데이터(RWD)에서 얻은 증거는 규제 평가 및 의료 의사 결정에 점점 더 중요한 역할을 하고 있습니다. 행정 청구 데이터는 전국 규모의 장기적인 의료 이용, 지출 및 진단, 시술, 약물에 대한 상세한 코딩 정보를 제공하지만, 이러한 데이터가 의료 기반 모델의 기반으로 사용될 가능성은 아직 충분히 탐구되지 않았습니다. 본 연구에서는 2008년부터 2022년까지의 MarketScan 청구 데이터에 포함된 2억 명 이상의 가입자로부터 수집된 438억 건의 의료 이벤트를 사용하여 처음부터 학습된 생성형 트랜스포머 모델인 ReClaim을 소개합니다. ReClaim 모델은 진단, 시술, 약물 및 지출에 걸쳐 장기적인 경향을 모델링하며, 1억 4천만, 7억, 17억 개의 파라미터로 확장되었습니다. 1,000건 이상의 질병 발생 예측 작업에서 ReClaim은 평균 AUC 75.6%를 달성하여, 질병별 LightGBM (66.3%) 및 트랜스포머 기반 Delphi 모델 (69.4%)보다 훨씬 뛰어난 성능을 보였으며, 특히 희귀 질병에서 더 큰 성능 향상을 보였습니다. 이러한 장점은 과거 및 미래 평가 모두에서, 그리고 두 개의 독립적인 데이터 세트에 대한 외부 검증에서도 유지되었습니다. 모델의 성능은 규모가 커질수록 꾸준히 향상되었으며, 추가 학습은 사전 학습만으로는 얻을 수 없는 13.8%의 성능 향상을 가져왔습니다. 질병 예측 외에도 ReClaim은 재정적 결과를 파악하고 실증적 근거(RWE) 분석을 개선했습니다. 의료 지출 예측의 경우, LightGBM과 비교하여 설명된 분산을 0.28에서 0.37로 증가시켰으며, 표적 임상 시험 에뮬레이션에서는 Delphi 모델에 비해 평균 72%의 체계적 편향을 감소시켰습니다. 종합적으로, 이러한 결과는 행정 청구 데이터를 의료 기반 모델을 위한 확장 가능한 기반으로 활용할 수 있음을 보여주며, 학습된 표현이 시간 경과 및 데이터 소스에 걸쳐 일반화되어 질병 감시, 지출 예측 및 RWE 생성에 기여할 수 있음을 시사합니다.
Evidence derived from large-scale real-world data (RWD) is increasingly informing regulatory evaluation and healthcare decision-making. Administrative claims provide population-scale, longitudinal records of healthcare utilization, expenditure, and detailed coding of diagnoses, procedures, and medications, yet their potential as a substrate for healthcare foundation models remains largely unexplored. Here we present ReClaim, a generative transformer trained from scratch on 43.8 billion medical events from more than 200 million enrollees in the MarketScan claims data spanning 2008-2022. ReClaim models longitudinal trajectories across diagnoses, procedures, medications, and expenditure, and was scaled to 140 million, 700 million, and 1.7 billion parameters. Across over 1,000 disease-onset prediction tasks, ReClaim achieved a mean AUC of 75.6%, substantially outperforming disease-specific LightGBM (66.3%) and the transformer-based Delphi model (69.4%), with the largest gains for rare diseases. These advantages held across retrospective and prospective evaluations and in external validation on two independent datasets. Performance improved monotonically with scale, and post-training added 13.8 percentage points over pre-training alone. Beyond disease prediction, ReClaim captured financial outcomes and improved real-world evidence (RWE) analyses: for healthcare expenditure forecasting it increased explained variance from 0.28 to 0.37 relative to LightGBM, and in a target trial emulation it reduced systematic bias by 72% on average relative to Delphi. Together, these results establish administrative claims as a scalable substrate for healthcare foundation models and show that learned representations generalize across time periods and data sources, supporting disease surveillance, expenditure forecasting, and RWE generation.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.