유방 초음파 영상 증강을 위한 하이브리드 디퓨전 모델
Hybrid Diffusion Model for Breast Ultrasound Image Augmentation
본 논문에서는 유방 초음파(BUS) 데이터셋에서 초음파 데이터 증강의 중요한 과제를 해결하기 위한 하이브리드 디퓨전 기반 증강 프레임워크를 제안합니다. 기존의 디퓨전 기반 증강 방법과는 달리, 본 연구에서는 텍스트-이미지 생성과 이미지-이미지(img2img) 정제를 결합하고, 로우 랭크 어댑테이션(LoRA) 및 텍스트 인버전(TI)을 활용하여 시각적 충실도를 향상시키고 초음파 질감을 보존합니다. 제안하는 방법은 오픈 소스 Kaggle 유방 초음파 이미지 데이터셋(BUSI)에서 현실적이고 클래스 일관성을 갖는 이미지를 생성했습니다. 텍스트 인버전(TI) 및 이미지-이미지(img2img) 정제를 적용한 결과, Stable Diffusion v1.5의 기준 모델과 비교하여 프레체트 인셉션 거리(FID)가 45.97에서 33.29로 감소하여 상당한 충실도 향상을 보였으며, 다운스트림 분류 성능은 유사하게 유지되었습니다. 전반적으로, 제안하는 프레임워크는 합성 초음파 이미지의 낮은 충실도 문제를 효과적으로 완화하고, 강력한 진단 모델링을 위한 증강 품질을 향상시킵니다.
We propose a hybrid diffusion-based augmentation framework to overcome the critical challenge of ultrasound data augmentation in breast ultrasound (BUS) datasets. Unlike conventional diffusion-based augmentations, our approach improves visual fidelity and preserves ultrasound texture by combining text-to-image generation with image-to-image (img2img) refinement, as well as fine-tuning with low-rank adaptation (LoRA) and textual inversion (TI). Our method generated realistic, class-consistent images on an open-source Kaggle breast ultrasound image dataset (BUSI). Compared to the Stable Diffusion v1.5 baseline, incorporating TI and img2img refinement reduced the Frechet Inception Distance (FID) from 45.97 to 33.29, demonstrating a substantial gain in fidelity while maintaining comparable downstream classification performance. Overall, the proposed framework effectively mitigates the low-fidelity limitations of synthetic ultrasound images and enhances the quality of augmentation for robust diagnostic modeling.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.