단백질 표현 학습을 위한 MMPG: MoE 기반 적응형 다중 관점 그래프 융합
MMPG: MoE-based Adaptive Multi-Perspective Graph Fusion for Protein Representation Learning
잔기 상호작용 네트워크는 자연스럽게 그래프로 표현될 수 있기 때문에 그래프 신경망(GNN)은 단백질 표현 학습(PRL)에 널리 채택되어 왔다. 현재의 GNN 기반 PRL 방법들은 일반적으로 잔기 상호작용의 부분적인 특성만을 포착하는 단일 관점 그래프 구축 전략에 의존하며, 이는 불완전한 단백질 표현을 초래한다. 이러한 한계를 해결하기 위해, 본 논문에서는 다중 관점에서 단백질 그래프를 구축하고 전문가 혼합(MoE)을 통해 이를 적응적으로 융합하는 PRL 프레임워크인 MMPG를 제안한다. MMPG는 잔기 상호작용의 다양한 특성을 규명하기 위해 물리적, 화학적, 기하학적 관점에서 그래프를 구축한다. 관점별 고유 특징과 그 시너지를 모두 포착하기 위해, 각 관점을 전문화된 전문가에게 동적으로 배정하는 MoE 모듈을 개발하였으며, 여기서 전문가는 고유 특징과 관점 간 상호작용을 학습한다. 우리는 MoE가 개별 표현에서부터 쌍별 관점 간 시너지, 그리고 마침내 모든 관점에 걸친 전역적 합의에 이르기까지 서로 다른 수준의 상호작용을 모델링하는 데 있어 전문가들을 자동으로 전문화함을 정량적으로 검증한다. 이러한 다단계 정보를 통합함으로써 MMPG는 우수한 단백질 표현을 생성하며, 4가지 다양한 단백질 다운스트림 태스크에서 향상된 성능을 달성한다.
Graph Neural Networks (GNNs) have been widely adopted for Protein Representation Learning (PRL), as residue interaction networks can be naturally represented as graphs. Current GNN-based PRL methods typically rely on single-perspective graph construction strategies, which capture partial properties of residue interactions, resulting in incomplete protein representations. To address this limitation, we propose MMPG, a framework that constructs protein graphs from multiple perspectives and adaptively fuses them via Mixture of Experts (MoE) for PRL. MMPG constructs graphs from physical, chemical, and geometric perspectives to characterize different properties of residue interactions. To capture both perspective-specific features and their synergies, we develop an MoE module, which dynamically routes perspectives to specialized experts, where experts learn intrinsic features and cross-perspective interactions. We quantitatively verify that MoE automatically specializes experts in modeling distinct levels of interaction from individual representations, to pairwise inter-perspective synergies, and ultimately to a global consensus across all perspectives. Through integrating this multi-level information, MMPG produces superior protein representations and achieves advanced performance on four different downstream protein tasks.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.