MieDB-100k: 의료 영상 편집을 위한 포괄적인 데이터셋
MieDB-100k: A Comprehensive Dataset for Medical Image Editing
다중 모드 생성 모델을 의료 영상 편집에 적용하는 데 있어 고품질 데이터의 부족은 주요한 걸림돌입니다. 기존의 의료 영상 편집 데이터셋은 종종 다양성 부족, 의료 영상 이해 부족, 그리고 품질과 확장성의 균형 부족과 같은 문제를 안고 있습니다. 이러한 문제점을 해결하기 위해, 우리는 텍스트 기반 의료 영상 편집을 위한 대규모, 고품질, 그리고 다양한 데이터셋인 MieDB-100k를 제안합니다. MieDB-100k는 편집 작업을 인식, 수정, 변환의 관점에서 분류하며, 이해 능력과 생성 능력을 모두 고려합니다. 우리는 MieDB-100k를 모드별 전문가 모델과 규칙 기반 데이터 합성 방법을 활용한 데이터 큐레이션 파이프라인을 통해 구축했으며, 임상적 정확성을 보장하기 위해 엄격한 수동 검사를 거쳤습니다. 광범위한 실험 결과, MieDB-100k로 훈련된 모델은 오픈 소스 및 독점 모델 모두에서 일관되게 더 높은 성능을 보이며, 강력한 일반화 능력을 보여줍니다. 우리는 이 데이터셋이 향후 특수 의료 영상 편집 분야의 발전에 중요한 기반이 될 것이라고 기대합니다.
The scarcity of high-quality data remains a primary bottleneck in adapting multimodal generative models for medical image editing. Existing medical image editing datasets often suffer from limited diversity, neglect of medical image understanding and inability to balance quality with scalability. To address these gaps, we propose MieDB-100k, a large-scale, high-quality and diverse dataset for text-guided medical image editing. It categorizes editing tasks into perspectives of Perception, Modification and Transformation, considering both understanding and generation abilities. We construct MieDB-100k via a data curation pipeline leveraging both modality-specific expert models and rule-based data synthetic methods, followed by rigorous manual inspection to ensure clinical fidelity. Extensive experiments demonstrate that model trained with MieDB-100k consistently outperform both open-source and proprietary models while exhibiting strong generalization ability. We anticipate that this dataset will serve as a cornerstone for future advancements in specialized medical image editing.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.