2604.18467v1 Apr 20, 2026 cs.LG

ConGA-PePPI 및 TC-PepGen을 활용한 펩타이드-단백질 상호작용 예측 및 타겟 조건에 따른 펩타이드 생성 통합 딥러닝 프레임워크

An Integrated Deep-Learning Framework for Peptide-Protein Interaction Prediction and Target-Conditioned Peptide Generation with ConGA-PePPI and TC-PepGen

Jixiu Zhai
Jixiu Zhai
Citations: 5
h-index: 1
J. Kong
J. Kong
Citations: 126
h-index: 5
Tianchi Lu
Tianchi Lu
Citations: 4
h-index: 1
Ronghao Xie
Ronghao Xie
Citations: 2
h-index: 1
Shangkun Sima
Shangkun Sima
Citations: 0
h-index: 0
Chupei Tang
Chupei Tang
Citations: 0
h-index: 0
Moyu Tang
Moyu Tang
Citations: 0
h-index: 0
Di Wang
Di Wang
Citations: 17
h-index: 2

배경: 펩타이드-단백질 상호작용(PepPI)은 세포 조절 및 펩타이드 치료에 중요한 역할을 하지만, 대규모 스크리닝을 위한 실험적 특성 분석은 여전히 시간이 오래 걸립니다. 기존 방법은 일반적으로 상호작용 예측 또는 펩타이드 생성 중 한 가지에 초점을 맞추며, 후보 물질 우선순위 결정, 잔기 수준 해석, 그리고 타겟 조건에 따른 확장 기능이 충분히 통합되어 있지 않습니다. 결과: 본 연구에서는 초기 단계 펩타이드 스크리닝을 위한 통합 프레임워크를 제시합니다. 이 프레임워크는 파트너 정보를 고려한 예측 및 위치 모델(ConGA-PepPI)과 타겟 조건에 따른 생성 모델(TC-PepGen)을 결합합니다. ConGA-PepPI는 비대칭 인코딩, 양방향 크로스 어텐션, 그리고 페어 예측에서 결합 부위 위치 추정으로의 점진적 전이 기능을 사용합니다. TC-PepGen은 레이어별 조건부 설정(layerwise conditioning)을 통해 자동 회귀 디코딩 과정에서 타겟 정보를 유지합니다. 5-배 교차 검증 결과, ConGA-PepPI는 0.839의 정확도와 0.921의 AUROC를 달성했으며, 단백질 측면에서 0.601, 펩타이드 측면에서 0.950의 결합 부위 AUPR 값을 보였으며, 외부 벤치마크에서도 경쟁력 있는 성능을 유지했습니다. 제어된 길이 조건 하에서, TC-PepGen이 생성한 펩타이드 중 40.39%가 AlphaFold 3 ipTM에서 네이티브 템플릿을 능가했으며, 제약 없는 생성 과정에서도 타겟 조건에 따른 신호가 유지되는 것을 확인했습니다.

Original Abstract

Motivation: Peptide-protein interactions (PepPIs) are central to cellular regulation and peptide therapeutics, but experimental characterization remains too slow for large-scale screening. Existing methods usually emphasize either interaction prediction or peptide generation, leaving candidate prioritization, residue-level interpretation, and target-conditioned expansion insufficiently integrated. Results: We present an integrated framework for early-stage peptide screening that combines a partner-aware prediction and localization model (ConGA-PepPI) with a target-conditioned generative model (TC-PepGen). ConGA-PepPI uses asymmetric encoding, bidirectional cross-attention, and progressive transfer from pair prediction to binding-site localization, while TC-PepGen preserves target information throughout autoregressive decoding via layerwise conditioning. In five-fold cross-validation, ConGA-PepPI achieved 0.839 accuracy and 0.921 AUROC, with binding-site AUPR values of 0.601 on the protein side and 0.950 on the peptide side, and remained competitive on external benchmarks. Under a controlled length-conditioned benchmark, 40.39% of TC-PepGen peptides exceeded native templates in AlphaFold 3 ipTM, and unconstrained generation retained evidence of target-conditioned signal.

0 Citations
0 Influential
2.5 Altmetric
12.5 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!