DIA-CLIP: 제로-샷 DIA 프로테오믹스를 위한 범용 표현 학습 프레임워크
DIA-CLIP: a universal representation learning framework for zero-shot DIA proteomics
데이터 독립성 획득 질량 분석법(DIA-MS)은 프로테오믹 프로파일링 및 대규모 시스템 생물학의 핵심 기술로 자리 잡았으며, 탁월한 심층 분석 및 재현성을 제공합니다. 그러나 현재 DIA 분석 프레임워크는 각 분석 과정 내에서 펩타이드-스펙트럼 매칭(PSM) 재점수를 매기기 위해 반지도 학습을 필요로 합니다. 이러한 접근 방식은 과적합의 가능성이 있으며, 다양한 종 및 실험 조건에 대한 일반화 능력이 부족합니다. 본 연구에서는 DIA-CLIP을 소개합니다. DIA-CLIP은 사전 학습된 모델로서 DIA 분석 패러다임을 반지도 학습에서 범용적인 교차 모드 표현 학습으로 전환합니다. DIA-CLIP은 이중 인코더 대비 학습 프레임워크와 인코더-디코더 아키텍처를 통합하여 펩타이드와 해당 스펙트럼 특징에 대한 통일된 교차 모드 표현을 구축하고, 고정밀의 제로-샷 PSM 추론을 가능하게 합니다. 다양한 벤치마크를 통한 광범위한 평가 결과, DIA-CLIP은 최첨단 도구보다 일관되게 우수한 성능을 보이며, 최대 45%의 단백질 식별률 향상을 가져오고 오탐 비율을 12% 감소시킵니다. 또한, DIA-CLIP은 단일 세포 및 공간 프로테오믹스와 같은 다양한 실제 응용 분야에서 잠재력을 가지고 있으며, 향상된 식별 능력을 통해 새로운 바이오마커 발굴 및 복잡한 세포 메커니즘 규명에 기여할 수 있습니다.
Data-independent acquisition mass spectrometry (DIA-MS) has established itself as a cornerstone of proteomic profiling and large-scale systems biology, offering unparalleled depth and reproducibility. Current DIA analysis frameworks, however, require semi-supervised training within each run for peptide-spectrum match (PSM) re-scoring. This approach is prone to overfitting and lacks generalizability across diverse species and experimental conditions. Here, we present DIA-CLIP, a pre-trained model shifting the DIA analysis paradigm from semi-supervised training to universal cross-modal representation learning. By integrating dual-encoder contrastive learning framework with encoder-decoder architecture, DIA-CLIP establishes a unified cross-modal representation for peptides and corresponding spectral features, achieving high-precision, zero-shot PSM inference. Extensive evaluations across diverse benchmarks demonstrate that DIA-CLIP consistently outperforms state-of-the-art tools, yielding up to a 45% increase in protein identification while achieving a 12% reduction in entrapment identifications. Moreover, DIA-CLIP holds immense potential for diverse practical applications, such as single-cell and spatial proteomics, where its enhanced identification depth facilitates the discovery of novel biomarkers and the elucidates of intricate cellular mechanisms.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.