2601.07261v1 Jan 12, 2026 cs.LG

가짜 데이터 기반 불변 표현 학습이 효소 운동 상수 예측의 분포 외 일반화 성능을 향상시킨다

Pseudodata-guided Invariant Representation Learning Boosts the Out-of-Distribution Generalization in Enzymatic Kinetic Parameter Prediction

Haomin Wu
Haomin Wu
Citations: 12
h-index: 3
Zhiwei Nie
Zhiwei Nie
Citations: 11
h-index: 2
Hongyu Zhang
Hongyu Zhang
Citations: 14
h-index: 3
Zhixiang Ren
Zhixiang Ren
Citations: 20
h-index: 3

정확한 효소 운동 상수 예측은 촉매 메커니즘을 이해하고 효소 공학을 위한 지침을 제공하는 데 필수적입니다. 그러나 기존의 딥러닝 기반 효소-기질 상호작용(ESI) 예측 모델은 종서열이 다른, 분포 외(OOD) 데이터에서 성능 저하를 보이는 경우가 많아, 생물학적으로 관련된 변화에 대한 견고성이 제한됩니다. 본 연구에서는 생물학적 및 화학적 정보를 기반으로 한 교란 증강(perturbation augmentation)과 불변 표현 학습을 통해 OOD 일반화 성능을 향상시키는 경량의 모듈형 O$^2$DENet을 제안합니다. O$^2$DENet은 효소-기질 쌍에 대한 교란을 도입하고, 원래 데이터와 증강된 데이터의 효소-기질 쌍 표현 간의 일관성을 유지하여 분포 변화에 대한 불변성을 유도합니다. 대표적인 ESI 모델에 O$^2$DENet을 통합하면, 엄격한 종서열 동일성 기반 OOD 벤치마크에서 $k_{cat}$과 $K_m$ 모두에 대한 예측 성능이 지속적으로 향상되며, 정확도 및 견고성 지표 측면에서 평가된 방법 중 최고 수준의 결과를 달성합니다. 전반적으로, O$^2$DENet은 실제 효소 공학 응용 분야를 위한 데이터 기반 효소 운동 상수 예측 모델의 안정성과 활용성을 향상시키는 일반적이고 효과적인 전략을 제공합니다.

Original Abstract

Accurate prediction of enzyme kinetic parameters is essential for understanding catalytic mechanisms and guiding enzyme engineering.However, existing deep learning-based enzyme-substrate interaction (ESI) predictors often exhibit performance degradation on sequence-divergent, out-of-distribution (OOD) cases, limiting robustness under biologically relevant perturbations.We propose O$^2$DENet, a lightweight, plug-and-play module that enhances OOD generalization via biologically and chemically informed perturbation augmentation and invariant representation learning.O$^2$DENet introduces enzyme-substrate perturbations and enforces consistency between original and augmented enzyme-substrate-pair representations to encourage invariance to distributional shifts.When integrated with representative ESI models, O$^2$DENet consistently improves predictive performance for both $k_{cat}$ and $K_m$ across stringent sequence-identity-based OOD benchmarks, achieving state-of-the-art results among the evaluated methods in terms of accuracy and robustness metrics.Overall, O$^2$DENet provides a general and effective strategy to enhance the stability and deployability of data-driven enzyme kinetics predictors for real-world enzyme engineering applications.

0 Citations
0 Influential
1.5 Altmetric
7.5 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!