ConGA-PePPI 및 TC-PepGen을 활용한 펩타이드-단백질 상호작용 예측 및 타겟 조건에 따른 펩타이드 생성 통합 딥러닝 프레임워크
An Integrated Deep-Learning Framework for Peptide-Protein Interaction Prediction and Target-Conditioned Peptide Generation with ConGA-PePPI and TC-PepGen
배경: 펩타이드-단백질 상호작용(PepPI)은 세포 조절 및 펩타이드 치료에 중요한 역할을 하지만, 대규모 스크리닝을 위한 실험적 특성 분석은 여전히 시간이 오래 걸립니다. 기존 방법은 일반적으로 상호작용 예측 또는 펩타이드 생성 중 한 가지에 초점을 맞추며, 후보 물질 우선순위 결정, 잔기 수준 해석, 그리고 타겟 조건에 따른 확장 기능이 충분히 통합되어 있지 않습니다. 결과: 본 연구에서는 초기 단계 펩타이드 스크리닝을 위한 통합 프레임워크를 제시합니다. 이 프레임워크는 파트너 정보를 고려한 예측 및 위치 모델(ConGA-PepPI)과 타겟 조건에 따른 생성 모델(TC-PepGen)을 결합합니다. ConGA-PepPI는 비대칭 인코딩, 양방향 크로스 어텐션, 그리고 페어 예측에서 결합 부위 위치 추정으로의 점진적 전이 기능을 사용합니다. TC-PepGen은 레이어별 조건부 설정(layerwise conditioning)을 통해 자동 회귀 디코딩 과정에서 타겟 정보를 유지합니다. 5-배 교차 검증 결과, ConGA-PepPI는 0.839의 정확도와 0.921의 AUROC를 달성했으며, 단백질 측면에서 0.601, 펩타이드 측면에서 0.950의 결합 부위 AUPR 값을 보였으며, 외부 벤치마크에서도 경쟁력 있는 성능을 유지했습니다. 제어된 길이 조건 하에서, TC-PepGen이 생성한 펩타이드 중 40.39%가 AlphaFold 3 ipTM에서 네이티브 템플릿을 능가했으며, 제약 없는 생성 과정에서도 타겟 조건에 따른 신호가 유지되는 것을 확인했습니다.
Motivation: Peptide-protein interactions (PepPIs) are central to cellular regulation and peptide therapeutics, but experimental characterization remains too slow for large-scale screening. Existing methods usually emphasize either interaction prediction or peptide generation, leaving candidate prioritization, residue-level interpretation, and target-conditioned expansion insufficiently integrated. Results: We present an integrated framework for early-stage peptide screening that combines a partner-aware prediction and localization model (ConGA-PepPI) with a target-conditioned generative model (TC-PepGen). ConGA-PepPI uses asymmetric encoding, bidirectional cross-attention, and progressive transfer from pair prediction to binding-site localization, while TC-PepGen preserves target information throughout autoregressive decoding via layerwise conditioning. In five-fold cross-validation, ConGA-PepPI achieved 0.839 accuracy and 0.921 AUROC, with binding-site AUPR values of 0.601 on the protein side and 0.950 on the peptide side, and remained competitive on external benchmarks. Under a controlled length-conditioned benchmark, 40.39% of TC-PepGen peptides exceeded native templates in AlphaFold 3 ipTM, and unconstrained generation retained evidence of target-conditioned signal.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.