2601.03689v1 Jan 07, 2026 cs.LG

결합 변환 패턴을 포착하는 사전 학습된 반응 임베딩 기술

A Pre-trained Reaction Embedding Descriptor Capturing Bond Transformation Patterns

Weiqi Liu
Weiqi Liu
Citations: 105
h-index: 3
Fenglei Cao
Fenglei Cao
Citations: 52
h-index: 4
Yuan Qi
Yuan Qi
Citations: 59
h-index: 4
Li-Cheng Xu
Li-Cheng Xu
Citations: 11
h-index: 2

데이터 기반 반응 예측 모델의 발전과 함께, 실제 화학 반응과 디지털 표현 간의 간극을 좁히기 위한 효과적인 반응 기술은 매우 중요합니다. 그러나 범용적이고 반응별 기술은 여전히 부족한 실정입니다. 본 연구에서는 RXNGraphormer 모델을 기반으로, 실제 반응과 오류가 있는 결합 변화를 포함하는 가상 반응을 구별하도록 사전 학습된 새로운 반응 수준 기술인 RXNEmb를 소개합니다. RXNEmb는 고유한 결합 형성 및 절단 패턴을 학습합니다. USPTO-50k 데이터 세트를 데이터 기반 방식으로 재분류하여 RXNEmb의 유용성을 입증한 결과, 규칙 기반 범주보다 결합 변화의 유사성을 더욱 직접적으로 반영하는 분류 결과를 얻었습니다. 차원 축소와 함께 RXNEmb를 사용하면 반응 공간의 다양성을 시각화할 수 있습니다. 또한, 어텐션 가중치 분석을 통해 모델이 화학적으로 중요한 영역에 집중하는 것을 확인하여, 반응 메커니즘에 대한 통찰력을 제공합니다. RXNEmb는 반응 지문 분석 및 분석을 위한 강력하고 해석 가능한 도구로서, 반응 분석 및 발견 분야에서 데이터 중심적인 접근 방식을 위한 길을 열어줍니다.

Original Abstract

With the rise of data-driven reaction prediction models, effective reaction descriptors are crucial for bridging the gap between real-world chemistry and digital representations. However, general-purpose, reaction-wise descriptors remain scarce. This study introduces RXNEmb, a novel reaction-level descriptor derived from RXNGraphormer, a model pre-trained to distinguish real reactions from fictitious ones with erroneous bond changes, thereby learning intrinsic bond formation and cleavage patterns. We demonstrate its utility by data-driven re-clustering of the USPTO-50k dataset, yielding a classification that more directly reflects bond-change similarities than rule-based categories. Combined with dimensionality reduction, RXNEmb enables visualization of reaction space diversity. Furthermore, attention weight analysis reveals the model's focus on chemically critical sites, providing mechanistic insight. RXNEmb serves as a powerful, interpretable tool for reaction fingerprinting and analysis, paving the way for more data-centric approaches in reaction analysis and discovery.

0 Citations
0 Influential
2 Altmetric
10.0 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!