2601.16414v1 Jan 23, 2026 cs.LG

PyHealth 2.0: 접근 가능하고 재현 가능한 임상 딥러닝을 위한 종합적인 오픈 소스 툴킷

PyHealth 2.0: A Comprehensive Open-Source Toolkit for Accessible and Reproducible Clinical Deep Learning

Sayeed Sajjad Razin
Sayeed Sajjad Razin
Citations: 7
h-index: 1
John Wu
John Wu
Citations: 17
h-index: 1
Siddhartha Laghuvarapu
Siddhartha Laghuvarapu
Citations: 223
h-index: 8
Jathurshan Pradeepkumar
Jathurshan Pradeepkumar
Citations: 106
h-index: 5
Joshua Steier
Joshua Steier
Citations: 11
h-index: 1
Yong Fan
Yong Fan
Citations: 156
h-index: 3
Zhenbang Wu
Zhenbang Wu
Citations: 1,206
h-index: 8
Paul Landes
Paul Landes
Citations: 3
h-index: 1
Arjun Chatterjee
Arjun Chatterjee
Citations: 24
h-index: 3
N. Baskaran
N. Baskaran
Citations: 29
h-index: 2
A. Fitzpatrick
A. Fitzpatrick
Citations: 92
h-index: 4
Bilal Arif
Bilal Arif
Citations: 16
h-index: 2
Rian Atri
Rian Atri
Citations: 0
h-index: 0
Junyi Gao
Junyi Gao
Citations: 7
h-index: 2
Adam R. Cross
Adam R. Cross
Citations: 10
h-index: 2
Jimeng Sun
Jimeng Sun
Citations: 62
h-index: 2
Eric Schrock
Eric Schrock
Citations: 91
h-index: 3

기준 성능 재현의 어려움, 높은 계산 비용, 그리고 필요한 전문 지식은 임상 인공지능 연구에 지속적인 장벽을 만듭니다. 이러한 문제점을 해결하기 위해, 우리는 7줄의 코드로 예측 모델링을 가능하게 하는 향상된 임상 딥러닝 툴킷인 PyHealth 2.0을 소개합니다. PyHealth 2.0은 세 가지 주요 기여를 합니다: (1) 15개 이상의 데이터셋, 20개 이상의 임상 작업, 25개 이상의 모델, 5개 이상의 해석 방법, 그리고 컨포멀 예측을 포함한 불확실성 정량화 기능을 단일 프레임워크 내에서 통합하여 재현 가능성과 호환성 문제를 해결하는 종합적인 툴킷을 제공하며, 다양한 임상 데이터 모달리티(신호, 이미지, 전자 건강 기록)를 지원하고 5개 이상의 의료 코딩 표준을 번역합니다. (2) 다중 모달 데이터와 다양한 컴퓨팅 자원을 수용하는 접근성 중심 설계로, 최대 39배 빠른 처리 속도와 20배 낮은 메모리 사용량을 제공하여 16GB 노트북에서부터 프로덕션 시스템까지 다양한 환경에서 사용 가능합니다. (3) 400명 이상의 활발한 오픈 소스 커뮤니티를 통해 광범위한 문서, 재현 가능한 연구 기여, 그리고 학술 의료 시스템 및 산업 파트너와의 협력을 통해 전문 지식 장벽을 낮추고 있으며, RHealth를 통해 다국어 지원도 제공합니다. PyHealth 2.0은 접근 가능하고 재현 가능한 의료 인공지능을 발전시키는 오픈 소스 기반과 커뮤니티를 구축합니다. pip install pyhealth을 통해 사용할 수 있습니다.

Original Abstract

Difficulty replicating baselines, high computational costs, and required domain expertise create persistent barriers to clinical AI research. To address these challenges, we introduce PyHealth 2.0, an enhanced clinical deep learning toolkit that enables predictive modeling in as few as 7 lines of code. PyHealth 2.0 offers three key contributions: (1) a comprehensive toolkit addressing reproducibility and compatibility challenges by unifying 15+ datasets, 20+ clinical tasks, 25+ models, 5+ interpretability methods, and uncertainty quantification including conformal prediction within a single framework that supports diverse clinical data modalities - signals, imaging, and electronic health records - with translation of 5+ medical coding standards; (2) accessibility-focused design accommodating multimodal data and diverse computational resources with up to 39x faster processing and 20x lower memory usage, enabling work from 16GB laptops to production systems; and (3) an active open-source community of 400+ members lowering domain expertise barriers through extensive documentation, reproducible research contributions, and collaborations with academic health systems and industry partners, including multi-language support via RHealth. PyHealth 2.0 establishes an open-source foundation and community advancing accessible, reproducible healthcare AI. Available at pip install pyhealth.

0 Citations
0 Influential
4 Altmetric
20.0 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!