Phi-Former: 화합물-단백질 상호작용 예측을 위한 쌍별 계층적 접근법
Phi-Former: A Pairwise Hierarchical Approach for Compound-Protein Interactions Prediction
신약 개발은 여전히 많은 시간과 노동력, 비용이 소요되는 과정이며, 약물 후보 물질 하나당 수년의 시간과 막대한 투자가 필요한 경우가 많습니다. 화합물-단백질 상호작용(CPI) 예측은 이 과정의 핵심 요소로, 약물 후보 물질과 표적 단백질 간의 분자적 상호작용 식별을 가능하게 합니다. 최근의 딥러닝 방법들은 원자 수준에서 CPI를 성공적으로 모델링하여 기존의 에너지 기반 접근법보다 향상된 효율성과 정확도를 달성했습니다. 그러나 생물학적 인식 및 결합의 주 단위가 통상적으로 분자 조각(모티프 또는 작용기)으로 작용한다는 점에서, 이러한 모델들이 항상 화학적 현실과 부합하는 것은 아닙니다. 본 논문에서는 CPI 내 모티프의 생물학적 역할을 통합하여 이러한 문제를 해결하는 쌍별 계층적 상호작용 표현 학습 방법인 Phi-former를 제안합니다. Phi-former는 화합물과 단백질을 계층적으로 표현하고, 생물학적 시스템이 분자 파트너를 인식하는 방식을 반영하여 원자-원자, 모티프-모티프, 원자-모티프 수준 전반에 걸쳐 상호작용을 체계적으로 모델링하는 쌍별 사전 학습 프레임워크를 채택합니다. 또한 서로 다른 상호작용 수준이 상호 보완적으로 작용하도록 레벨 내 및 레벨 간 학습 파이프라인을 설계했습니다. 실험 결과, Phi-former는 CPI 관련 작업에서 우수한 성능을 달성했습니다. 사례 연구에 따르면 본 방법은 CPI에서 활성화되는 특정 원자나 모티프를 정확하게 식별하여 해석 가능한 모델 설명을 제공하는 것으로 나타났습니다. 이러한 통찰은 합리적인 신약 설계를 안내하고 정밀 의학 응용을 지원할 수 있습니다.
Drug discovery remains time-consuming, labor-intensive, and expensive, often requiring years and substantial investment per drug candidate. Predicting compound-protein interactions (CPIs) is a critical component in this process, enabling the identification of molecular interactions between drug candidates and target proteins. Recent deep learning methods have successfully modeled CPIs at the atomic level, achieving improved efficiency and accuracy over traditional energy-based approaches. However, these models do not always align with chemical realities, as molecular fragments (motifs or functional groups) typically serve as the primary units of biological recognition and binding. In this paper, we propose Phi-former, a pairwise hierarchical interaction representation learning method that addresses this gap by incorporating the biological role of motifs in CPIs. Phi-former represents compounds and proteins hierarchically and employs a pairwise pre-training framework to model interactions systematically across atom-atom, motif-motif, and atom-motif levels, reflecting how biological systems recognize molecular partners. We design intra-level and inter-level learning pipelines that make different interaction levels mutually beneficial. Experimental results demonstrate that Phi-former achieves superior performance on CPI-related tasks. A case study shows that our method accurately identifies specific atoms or motifs activated in CPIs, providing interpretable model explanations. These insights may guide rational drug design and support precision medicine applications.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.