MedGemma 1.5 기술 보고서
MedGemma 1.5 Technical Report
본 보고서에서는 MedGemma 컬렉션의 최신 모델인 MedGemma 1.5 4B를 소개합니다. MedGemma 1.5는 MedGemma 1에 다음과 같은 추가 기능을 통합하여 확장되었습니다. 고차원 의료 영상(CT/MRI 볼륨 및 전체 슬라이드 병리 이미지), 경계 상자를 통한 해부학적 위치 파악, 다중 시점 흉부 X선 분석, 그리고 향상된 의료 문서 이해(검사 보고서, 전자 건강 기록)입니다. 이러한 기능들을 단일 아키텍처 내에 구현하기 위해 필요한 혁신들을 자세히 설명합니다. 여기에는 새로운 학습 데이터, 긴 컨텍스트 3D 볼륨 슬라이싱, 그리고 전체 슬라이드 병리 샘플링이 포함됩니다. MedGemma 1.5 4B는 MedGemma 1 4B에 비해 새로운 영역에서 상당한 성능 향상을 보입니다. 특히, 3D MRI 질병 분류 정확도가 11% 향상되었고, 3D CT 질병 분류 정확도가 3% 향상되었습니다 (절대 증가). 전체 슬라이드 병리 이미지 분석에서는 47%의 매크로 F1 점수 향상을 달성했습니다. 또한, 흉부 X선 이미지에서 Intersection over Union이 35% 증가하여 해부학적 위치 파악 능력이 향상되었으며, 종단(다중 시점) 흉부 X선 분석에서 4%의 매크로 정확도를 달성했습니다. MedGemma 1.5는 MedGemma 1보다 향상된 다중 모드 성능뿐만 아니라, 텍스트 기반 임상 지식 및 추론 능력도 향상되었습니다. MedQA 정확도가 5% 향상되었고, EHRQA 정확도가 22% 향상되었습니다. 또한, 4가지 서로 다른 검사 보고서 정보 추출 데이터셋(EHR Datasets 2, 3, 4 및 Mendeley Clinical Laboratory Test Reports)에서 평균 18%의 매크로 F1 점수를 달성했습니다. 종합적으로, MedGemma 1.5는 커뮤니티를 위한 강력하고 개방적인 리소스로, 개발자들이 차세대 의료 AI 시스템을 구축할 수 있도록 설계된 개선된 기반을 제공합니다. MedGemma 1.5를 기반으로 구축하기 위한 리소스 및 튜토리얼은 https://goo.gle/MedGemma 에서 확인할 수 있습니다.
We introduce MedGemma 1.5 4B, the latest model in the MedGemma collection. MedGemma 1.5 expands on MedGemma 1 by integrating additional capabilities: high-dimensional medical imaging (CT/MRI volumes and histopathology whole slide images), anatomical localization via bounding boxes, multi-timepoint chest X-ray analysis, and improved medical document understanding (lab reports, electronic health records). We detail the innovations required to enable these modalities within a single architecture, including new training data, long-context 3D volume slicing, and whole-slide pathology sampling. Compared to MedGemma 1 4B, MedGemma 1.5 4B demonstrates significant gains in these new areas, improving 3D MRI condition classification accuracy by 11% and 3D CT condition classification by 3% (absolute improvements). In whole slide pathology imaging, MedGemma 1.5 4B achieves a 47% macro F1 gain. Additionally, it improves anatomical localization with a 35% increase in Intersection over Union on chest X-rays and achieves a 4% macro accuracy for longitudinal (multi-timepoint) chest x-ray analysis. Beyond its improved multimodal performance over MedGemma 1, MedGemma 1.5 improves on text-based clinical knowledge and reasoning, improving by 5% on MedQA accuracy and 22% on EHRQA accuracy. It also achieves an average of 18% macro F1 on 4 different lab report information extraction datasets (EHR Datasets 2, 3, 4, and Mendeley Clinical Laboratory Test Reports). Taken together, MedGemma 1.5 serves as a robust, open resource for the community, designed as an improved foundation on which developers can create the next generation of medical AI systems. Resources and tutorials for building upon MedGemma 1.5 can be found at https://goo.gle/MedGemma.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.