2603.14797v1 Mar 16, 2026 cs.LG

단백질-뉴클레오타이드 결합 부위 예측을 위한 다중 작업 유전 알고리즘 및 다중 분해능 인코딩

Multi-Task Genetic Algorithm with Multi-Granularity Encoding for Protein-Nucleotide Binding Site Prediction

Kevin I-Kai Wang
Kevin I-Kai Wang
Citations: 0
h-index: 0
Yiming Gao
Yiming Gao
Citations: 2
h-index: 1
Pengshan Cui
Pengshan Cui
Citations: 76
h-index: 2

단백질-뉴클레오타이드 결합 부위의 정확한 식별은 분자 메커니즘을 이해하고 신약 개발을 가속화하는 데 필수적입니다. 그러나 현재의 계산 방법은 종종 부적절한 특징 표현과 경직된 융합 메커니즘으로 인해 최적의 성능을 달성하지 못하며, 이는 여러 작업 간의 정보 시너지 효과를 효과적으로 활용하는 데 어려움을 초래합니다. 이러한 격차를 해소하기 위해, 본 연구에서는 결합 부위 예측 성능을 향상시키기 위해 다중 작업 유전 알고리즘(Multi-Task Genetic Algorithm, MTGA)과 다중 분해능 인코딩(Multi-Granularity Encoding, MGE)을 통합한 MTGA-MGE 프레임워크를 제안합니다. 특히, 우리는 다중 스케일 컨볼루션과 자기 주의 메커니즘을 결합하여 고차원적이고 중복된 생물학적 데이터로부터 유용한 정보를 추출하는 다중 분해능 인코딩(MGE) 네트워크를 개발했습니다. 또한, 정적인 융합 방식의 제약을 극복하기 위해, 유전 알고리즘을 사용하여 작업별 융합 전략을 적응적으로 진화시켜 모델의 일반화 성능을 효과적으로 향상시켰습니다. 더욱이, 협력적 학습을 촉진하기 위해, 우리는 생물학적 유사성을 활용하여 작업 간의 표적 정보 교환을 용이하게 하는 외부 이웃 메커니즘(External-Neighborhood Mechanism, ENM)을 도입했습니다. 15개의 뉴클레오타이드 데이터 세트에 대한 광범위한 평가 결과, MTGA-MGE는 데이터가 풍부하고 자원이 풍부한 환경에서 새로운 최고 성능을 달성할 뿐만 아니라, 희소하고 자원이 부족한 환경에서도 강력한 경쟁력을 유지하며, 후유전체 시대에 복잡한 단백질-리간드 상호작용을 해석하기 위한 매우 적응적인 방법을 제시합니다.

Original Abstract

Accurate identification of protein-nucleotide binding sites is fundamental to deciphering molecular mechanisms and accelerating drug discovery. However, current computational methods often struggle with suboptimal performance due to inadequate feature representation and rigid fusion mechanisms, which hinder the effective exploitation of cross-task information synergy. To bridge this gap, we propose MTGA-MGE, a framework that integrates a Multi-Task Genetic Algorithm with Multi-Granularity Encoding to enhance binding site prediction. Specifically, we develop a Multi-Granularity Encoding (MGE) network that synergizes multi-scale convolutions and self-attention mechanisms to distill discriminative signals from high-dimensional, redundant biological data. To overcome the constraints of static fusion, a genetic algorithm is employed to adaptively evolve task-specific fusion strategies, thereby effectively improving model generalization. Furthermore, to catalyze collaborative learning, we introduce an External-Neighborhood Mechanism (ENM) that leverages biological similarities to facilitate targeted information exchange across tasks. Extensive evaluations on fifteen nucleotide datasets demonstrate that MTGA-MGE not only establishes a new state-of-the-art in data-abundant, high-resource scenarios but also maintains a robust competitive edge in rare, low-resource regimes, presenting a highly adaptive scheme for decoding complex protein-ligand interactions in the post-genomic era.

0 Citations
0 Influential
1 Altmetric
5.0 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!