2601.05330v1 Jan 08, 2026 cs.AI

하이퍼그래프 강화 지식 그래프 임베딩을 이용한 화학 반응식 기반 효소 예측 개선

Improving Enzyme Prediction with Chemical Reaction Equations by Hypergraph-Enhanced Knowledge Graph Embeddings

Long Yin
Long Yin
Citations: 4
h-index: 1
Zhiqiang Xu
Zhiqiang Xu
Citations: 4
h-index: 1
Zhen Han
Zhen Han
Citations: 6
h-index: 1
Tengwei Song
Tengwei Song
Citations: 204
h-index: 5

효소-기질 상호작용 예측은 생화학 및 대사 공학 분야에서 오랫동안 근본적인 문제로 여겨져 왔습니다. 기존 방법들은 모델 학습을 위해 전문가가 선별한 효소-기질 쌍 데이터베이스를 활용할 수 있었지만, 이러한 데이터베이스는 종종 데이터가 희소하고(즉, 예시가 제한적이고 불완전함) 유지 관리에 많은 노동력이 소요됩니다. 이러한 충분한 훈련 데이터의 부족은 전통적인 효소 예측 모델이 본 적 없는 상호작용으로 일반화하는 능력을 크게 저해합니다. 본 연구에서는 도메인 특화 데이터베이스에서 접근이 용이하고 데이터 밀도가 높으며 풍부한 화학 반응식을 활용하고자 합니다. 그러나 동일한 효소와 반응물 및 생성물 등 다수 화합물 간의 상호작용은 전통적인 모델이 쉽게 포착할 수 없는 복잡한 관계 데이터 패턴을 생성합니다. 이를 해결하기 위해 우리는 화학 반응식을 지식 그래프 내에서 (반응물, 효소, 생성물)의 삼중항으로 표현하여, 지식 그래프 임베딩(KGE)을 활용해 누락된 효소-기질 쌍을 추론하고 그래프를 완성할 수 있도록 했습니다. 특히 화합물 간의 복잡한 관계를 포착하기 위해, 하이퍼그래프 트랜스포머와 KGE 모델을 통합하여 다수의 반응물 및 생성물을 포함하는 하이퍼 엣지의 표현을 학습하는 지식 강화 하이퍼그래프 효소 예측 모델인 Hyper-Enz를 제안합니다. 또한, 제안된 모델과 화학 반응식을 통해 효소-기질 상호작용 학습을 유도하는 다중 전문가(multi-expert) 패러다임을 도입했습니다. 실험 결과, 전통적인 모델 대비 평균 효소 검색 정확도에서 최대 88%의 상대적 향상과 쌍 수준 예측에서 30%의 향상을 보여주며 본 접근 방식의 유효성을 입증했습니다.

Original Abstract

Predicting enzyme-substrate interactions has long been a fundamental problem in biochemistry and metabolic engineering. While existing methods could leverage databases of expert-curated enzyme-substrate pairs for models to learn from known pair interactions, the databases are often sparse, i.e., there are only limited and incomplete examples of such pairs, and also labor-intensive to maintain. This lack of sufficient training data significantly hinders the ability of traditional enzyme prediction models to generalize to unseen interactions. In this work, we try to exploit chemical reaction equations from domain-specific databases, given their easier accessibility and denser, more abundant data. However, interactions of multiple compounds, e.g., educts and products, with the same enzymes create complex relational data patterns that traditional models cannot easily capture. To tackle that, we represent chemical reaction equations as triples of (educt, enzyme, product) within a knowledge graph, such that we can take advantage of knowledge graph embedding (KGE) to infer missing enzyme-substrate pairs for graph completion. Particularly, in order to capture intricate relationships among compounds, we propose our knowledge-enhanced hypergraph model for enzyme prediction, i.e., Hyper-Enz, which integrates a hypergraph transformer with a KGE model to learn representations of the hyper-edges that involve multiple educts and products. Also, a multi-expert paradigm is introduced to guide the learning of enzyme-substrate interactions with both the proposed model and chemical reaction equations. Experimental results show a significant improvement, with up to a 88% relative improvement in average enzyme retrieval accuracy and 30% improvement in pair-level prediction compared to traditional models, demonstrating the effectiveness of our approach.

0 Citations
0 Influential
2.5 Altmetric
12.5 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!