자가 진화형 심층 임상 연구를 통한 임상의 인지 모방
Emulating Clinician Cognition via Self-Evolving Deep Clinical Research
임상 진단은 역동적인 정보 습득과 지속적인 전문성 축적을 기반으로 하는 복잡한 인지 과정입니다. 하지만 현재 대부분의 인공지능(AI) 시스템은 이러한 현실과 동떨어져, 진단을 단일 단계의 후행 예측으로 취급하며, 투명하고 관리 가능한 개선 메커니즘을 결여하고 있습니다. 본 연구에서는 이러한 격차를 해소하기 위해, 상호 작용적인 심층 임상 연구 워크플로우를 통해 임상 진단 능력을 향상시키는 자가 진화형 진단 에이전트인 DxEvolve를 개발했습니다. DxEvolve는 자율적으로 검사를 요청하고, 증가하는 환자 데이터 노출을 통해 축적된 임상 경험을 진단 인지 요소로 지속적으로 활용합니다. MIMIC-CDM 벤치마크에서 DxEvolve는 기본 모델 대비 평균 11.2%의 진단 정확도 향상을 보였으며, 특정 하위 집합에서는 90.4%의 정확도를 달성하여, 임상의의 기준(88.8%)과 유사한 성능을 보였습니다. 또한, DxEvolve는 독립적인 외부 데이터셋에서 기존 방법 대비 10.2% (참조 데이터셋에 포함된 범주) 및 17.1% (참조 데이터셋에 포함되지 않은 범주)의 정확도 향상을 보였습니다. DxEvolve는 경험을 관리 가능한 학습 자원으로 변환하여, 임상 AI의 지속적인 발전을 위한 책임감 있는 경로를 제시합니다.
Clinical diagnosis is a complex cognitive process, grounded in dynamic cue acquisition and continuous expertise accumulation. Yet most current artificial intelligence (AI) systems are misaligned with this reality, treating diagnosis as single-pass retrospective prediction while lacking auditable mechanisms for governed improvement. We developed DxEvolve, a self-evolving diagnostic agent that bridges these gaps through an interactive deep clinical research workflow. The framework autonomously requisitions examinations and continually externalizes clinical experience from increasing encounter exposure as diagnostic cognition primitives. On the MIMIC-CDM benchmark, DxEvolve improved diagnostic accuracy by 11.2% on average over backbone models and reached 90.4% on a reader-study subset, comparable to the clinician reference (88.8%). DxEvolve improved accuracy on an independent external cohort by 10.2% (categories covered by the source cohort) and 17.1% (uncovered categories) compared to the competitive method. By transforming experience into a governable learning asset, DxEvolve supports an accountable pathway for the continual evolution of clinical AI.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.