RDFace: 극심한 데이터 부족 환경에서의 희귀 질환 얼굴 이미지 분석을 위한 벤치마크 데이터셋 - 표현형 기반 합성 데이터 생성
RDFace: A Benchmark Dataset for Rare Disease Facial Image Analysis under Extreme Data Scarcity and Phenotype-Aware Synthetic Generation
희귀 질환은 종종 어린이에게 독특한 얼굴 특징을 나타내며, 이는 임상의와 AI 기반 선별 시스템에 귀중한 진단 정보를 제공합니다. 그러나 이 분야의 발전은 큐레이션되고 윤리적으로 수집된 얼굴 데이터의 부족과 다양한 질환 간의 표현형 유사성으로 인해 심각하게 제한됩니다. 이러한 문제점을 해결하기 위해, 우리는 456개의 소아 얼굴 이미지로 구성된 벤치마크 데이터셋인 RDFace를 소개합니다. RDFace는 103개의 희귀 유전 질환(질환당 평균 4.4개의 샘플)을 포함하며, 각 이미지는 윤리적 검증을 거쳐 표준화된 메타데이터와 함께 제공됩니다. RDFace는 실제 환경의 데이터 부족 상황에서도 희귀 질환 진단을 위한 데이터 효율적인 AI 모델을 개발하고 평가할 수 있도록 지원합니다. 우리는 교차 검증을 통해 여러 사전 훈련된 비전 모델을 벤치마킹하고, DreamBooth 및 FastGAN을 사용하여 합성 데이터 증강을 탐색했습니다. 생성된 이미지는 얼굴 랜드마크 유사성을 통해 필터링하여 표현형의 정확성을 유지하고, 실제 데이터와 결합하여 극히 낮은 데이터 환경에서 최대 13.7%까지 진단 정확도를 향상시켰습니다. 또한, 비전-언어 모델을 사용하여 실제 및 합성 이미지에서 생성된 표현형 설명의 의미적 유효성을 평가한 결과, 보고 유사성 점수가 0.84를 달성했습니다. RDFace는 투명하고 벤치마크 준비가 완료된 데이터셋을 제공하여 희귀 질환 AI 연구의 공정성을 높이고, 진단 성능과 합성 의료 이미지의 무결성을 평가할 수 있는 확장 가능한 프레임워크를 제시합니다.
Rare diseases often manifest with distinctive facial phenotypes in children, offering valuable diagnostic cues for clinicians and AI-assisted screening systems. However, progress in this field is severely limited by the scarcity of curated, ethically sourced facial data and the high similarity among phenotypes across different conditions. To address these challenges, we introduce RDFace, a curated benchmark dataset comprising 456 pediatric facial images spanning 103 rare genetic conditions (average 4.4 samples per condition). Each ethically verified image is paired with standardized metadata. RDFace enables the development and evaluation of data-efficient AI models for rare disease diagnosis under real-world low-data constraints. We benchmark multiple pretrained vision backbones using cross-validation and explore synthetic augmentation with DreamBooth and FastGAN. Generated images are filtered via facial landmark similarity to maintain phenotype fidelity and merged with real data, improving diagnostic accuracy by up to 13.7% in ultra-low-data regimes. To assess semantic validity, phenotype descriptions generated by a vision-language model from real and synthetic images achieve a report similarity score of 0.84. RDFace establishes a transparent, benchmark-ready dataset for equitable rare disease AI research and presents a scalable framework for evaluating both diagnostic performance and the integrity of synthetic medical imagery.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.