2602.01772v1 Feb 02, 2026 cs.LG

DIA-CLIP: 제로-샷 DIA 프로테오믹스를 위한 범용 표현 학습 프레임워크

DIA-CLIP: a universal representation learning framework for zero-shot DIA proteomics

Yucheng Liao
Yucheng Liao
Citations: 0
h-index: 0
Han Wen
Han Wen
Citations: 4
h-index: 1
E. Weinan
E. Weinan
Citations: 126
h-index: 5
Weijie Zhang
Weijie Zhang
Citations: 15
h-index: 2

데이터 독립성 획득 질량 분석법(DIA-MS)은 프로테오믹 프로파일링 및 대규모 시스템 생물학의 핵심 기술로 자리 잡았으며, 탁월한 심층 분석 및 재현성을 제공합니다. 그러나 현재 DIA 분석 프레임워크는 각 분석 과정 내에서 펩타이드-스펙트럼 매칭(PSM) 재점수를 매기기 위해 반지도 학습을 필요로 합니다. 이러한 접근 방식은 과적합의 가능성이 있으며, 다양한 종 및 실험 조건에 대한 일반화 능력이 부족합니다. 본 연구에서는 DIA-CLIP을 소개합니다. DIA-CLIP은 사전 학습된 모델로서 DIA 분석 패러다임을 반지도 학습에서 범용적인 교차 모드 표현 학습으로 전환합니다. DIA-CLIP은 이중 인코더 대비 학습 프레임워크와 인코더-디코더 아키텍처를 통합하여 펩타이드와 해당 스펙트럼 특징에 대한 통일된 교차 모드 표현을 구축하고, 고정밀의 제로-샷 PSM 추론을 가능하게 합니다. 다양한 벤치마크를 통한 광범위한 평가 결과, DIA-CLIP은 최첨단 도구보다 일관되게 우수한 성능을 보이며, 최대 45%의 단백질 식별률 향상을 가져오고 오탐 비율을 12% 감소시킵니다. 또한, DIA-CLIP은 단일 세포 및 공간 프로테오믹스와 같은 다양한 실제 응용 분야에서 잠재력을 가지고 있으며, 향상된 식별 능력을 통해 새로운 바이오마커 발굴 및 복잡한 세포 메커니즘 규명에 기여할 수 있습니다.

Original Abstract

Data-independent acquisition mass spectrometry (DIA-MS) has established itself as a cornerstone of proteomic profiling and large-scale systems biology, offering unparalleled depth and reproducibility. Current DIA analysis frameworks, however, require semi-supervised training within each run for peptide-spectrum match (PSM) re-scoring. This approach is prone to overfitting and lacks generalizability across diverse species and experimental conditions. Here, we present DIA-CLIP, a pre-trained model shifting the DIA analysis paradigm from semi-supervised training to universal cross-modal representation learning. By integrating dual-encoder contrastive learning framework with encoder-decoder architecture, DIA-CLIP establishes a unified cross-modal representation for peptides and corresponding spectral features, achieving high-precision, zero-shot PSM inference. Extensive evaluations across diverse benchmarks demonstrate that DIA-CLIP consistently outperforms state-of-the-art tools, yielding up to a 45% increase in protein identification while achieving a 12% reduction in entrapment identifications. Moreover, DIA-CLIP holds immense potential for diverse practical applications, such as single-cell and spatial proteomics, where its enhanced identification depth facilitates the discovery of novel biomarkers and the elucidates of intricate cellular mechanisms.

0 Citations
0 Influential
2.5 Altmetric
12.5 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!