기회적 심혈관 건강 평가: 다중 모드 표현을 통한 로컬라이저 MRI로부터의 표현형 추정
Opportunistic Cardiac Health Assessment: Estimating Phenotypes from Localizer MRI through Multi-Modal Representations
심혈관 질환은 사망의 주요 원인입니다. 박출량과 같은 심장 표현형(CP)은 심혈관 건강을 평가하는 데 있어 가장 신뢰할 수 있는 지표이지만, 이는 비용이 많이 들고 높은 시공간 해상도를 요구하는 심장 자기 공명 영상(CMR)으로부터 얻어집니다. 모든 자기 공명(MR) 검사는 스캔 계획을 위한 빠르고 대략적인 로컬라이저 이미지를 먼저 획득하며, 이후 이러한 이미지는 버려집니다. 진단 품질이 낮고 시간 정보가 부족하지만, 로컬라이저 이미지는 유용한 구조적 정보를 빠르게 제공할 수 있습니다. 또한, 영상 데이터 외에도 환자의 인구통계학적 정보 및 생활 습관과 같은 환자 개인 정보는 심혈관 건강 평가에 영향을 미칩니다. 심전도(ECG)는 저렴하고, 임상 환경에서 일반적으로 사용되며, 심장의 시간적 활동을 기록합니다. 본 연구에서는 로컬라이저 MRI, ECG 신호 및 테이블 형식의 메타데이터를 통합하여 강력한 잠재 공간을 학습하고, 로컬라이저 이미지를 사용하여 CMR의 대안으로서 심장 표현형을 예측하는 다중 모드 프레임워크인 C-TRIP(Cardiac Tri-modal Representations for Imaging Phenotypes)을 소개합니다. 이러한 세 가지 모달리티를 결합함으로써, 우리는 로컬라이저에서 얻을 수 있는 저렴한 공간 정보와 ECG에서 얻을 수 있는 시간 정보를 활용하고, 동시에 테이블 데이터를 통해 제공되는 환자별 맥락을 활용합니다. 제안하는 파이프라인은 세 단계로 구성됩니다. 첫 번째 단계에서는 인코더를 독립적으로 훈련하여 단일 모드 표현을 학습합니다. 두 번째 단계에서는 사전 훈련된 인코더를 통합하여 잠재 공간을 통일합니다. 마지막 단계에서는 풍부해진 표현 공간을 사용하여 심장 표현형을 예측하며, 추론은 로컬라이저 MRI만을 사용하여 수행됩니다. 제안하는 C-TRIP은 정확한 기능적 심장 표현형을 제공하며, 구조적 심장 표현형에 대해서도 높은 상관 관계를 보입니다. 로컬라이저는 본질적으로 빠르고 저렴하므로, C-TRIP 프레임워크는 심장 표현형 추정에 대한 접근성을 향상시킬 수 있습니다.
Cardiovascular diseases are the leading cause of death. Cardiac phenotypes (CPs), e.g., ejection fraction, are the gold standard for assessing cardiac health, but they are derived from cine cardiac magnetic resonance imaging (CMR), which is costly and requires high spatio-temporal resolution. Every magnetic resonance (MR) examination begins with rapid and coarse localizers for scan planning, which are discarded thereafter. Despite non-diagnostic image quality and lack of temporal information, localizers can provide valuable structural information rapidly. In addition to imaging, patient-level information, including demographics and lifestyle, influence the cardiac health assessment. Electrocardiograms (ECGs) are inexpensive, routinely ordered in clinical practice, and capture the temporal activity of the heart. Here, we introduce C-TRIP (Cardiac Tri-modal Representations for Imaging Phenotypes), a multi-modal framework that aligns localizer MRI, ECG signals, and tabular metadata to learn a robust latent space and predict CPs using localizer images as an opportunistic alternative to CMR. By combining these three modalities, we leverage cheap spatial and temporal information from localizers, and ECG, respectively while benefiting from patient-specific context provided by tabular data. Our pipeline consists of three stages. First, encoders are trained independently to learn uni-modal representations. The second stage fuses the pre-trained encoders to unify the latent space. The final stage uses the enriched representation space for CP prediction, with inference performed exclusively on localizer MRI. Proposed C-TRIP yields accurate functional CPs, and high correlations for structural CPs. Since localizers are inherently rapid and low-cost, our C-TRIP framework could enable better accessibility for CP estimation.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.