2602.19158v1 Feb 22, 2026 cs.AI

DoAtlas-1: 임상 AI를 위한 인과적 컴파일 패러다임

DoAtlas-1: A Causal Compilation Paradigm for Clinical AI

Yulong Li
Yulong Li
Citations: 2
h-index: 1
Jianxu Chen
Jianxu Chen
Citations: 0
h-index: 0
Xiwei Liu
Xiwei Liu
Citations: 10
h-index: 2
Chuanyue Suo
Chuanyue Suo
Citations: 0
h-index: 0
Ronghui Xia
Ronghui Xia
Citations: 0
h-index: 0
Zhixiang Lu
Zhixiang Lu
Citations: 90
h-index: 7
Yichen Li
Yichen Li
Citations: 1
h-index: 1
Xinlin Zhuang
Xinlin Zhuang
Citations: 21
h-index: 2
N. Menon
N. Menon
Citations: 0
h-index: 0
Yutong Xie
Yutong Xie
Citations: 30
h-index: 2
Eran Segal
Eran Segal
Citations: 150
h-index: 3
I. Razzak
I. Razzak
Citations: 2
h-index: 1

의료 파운데이션 모델은 서술형 설명을 생성하지만 개입 효과를 정량화하거나, 근거 충돌을 감지하거나, 문헌의 주장을 검증할 수 없어 임상적 감사 가능성을 제한한다. 우리는 서술형 텍스트 형태의 의료 근거를 실행 가능한 코드로 변환하는 패러다임인 인과적 컴파일(causal compilation)을 제안한다. 이 패러다임은 이질적인 연구 근거들을 구조화된 추정 대상(estimand) 객체로 표준화한다. 각 객체는 개입 대조, 효과 척도, 시간 범위 및 대상 인구집단을 명시적으로 지정하여, do-연산(do-calculus), 반사실적 추론, 시간적 궤적, 이질적 효과, 기전적 분해 및 결합 개입이라는 여섯 가지 실행 가능한 인과 질의를 지원한다. 우리는 효과 표준화, 충돌 인지 그래프 구축 및 실제 데이터 검증(휴먼 페노타입 프로젝트, 10,000명 참여자)을 통해 754개 연구에서 1,445개의 효과 커널을 컴파일하여 이 패러다임을 DoAtlas-1에 구현했다. 이 시스템은 98.5%의 정규화 정확도와 80.5%의 질의 실행 가능성을 달성했다. 이 패러다임은 의료 AI를 텍스트 생성에서 실행 가능하고, 감사 가능하며, 검증 가능한 인과적 추론으로 전환시킨다.

Original Abstract

Medical foundation models generate narrative explanations but cannot quantify intervention effects, detect evidence conflicts, or validate literature claims, limiting clinical auditability. We propose causal compilation, a paradigm that transforms medical evidence from narrative text into executable code. The paradigm standardizes heterogeneous research evidence into structured estimand objects, each explicitly specifying intervention contrast, effect scale, time horizon, and target population, supporting six executable causal queries: do-calculus, counterfactual reasoning, temporal trajectories, heterogeneous effects, mechanistic decomposition, and joint interventions. We instantiate this paradigm in DoAtlas-1, compiling 1,445 effect kernels from 754 studies through effect standardization, conflict-aware graph construction, and real-world validation (Human Phenotype Project, 10,000 participants). The system achieves 98.5% canonicalization accuracy and 80.5% query executability. This paradigm shifts medical AI from text generation to executable, auditable, and verifiable causal reasoning.

0 Citations
0 Influential
3.5 Altmetric
17.5 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!