2602.02310v2 Feb 02, 2026 physics.chem-ph

FragmentFlow: 대규모 분자를 위한 확장 가능한 전이 상태 생성 방법

FragmentFlow: Scalable Transition State Generation for Large Molecules

T. Jaakkola
T. Jaakkola
Citations: 55,548
h-index: 109
Peter Holderrieth
Peter Holderrieth
Citations: 307
h-index: 4
Juno Nam
Juno Nam
Citations: 85
h-index: 5
Rafael G'omez-Bombarelli
Rafael G'omez-Bombarelli
Citations: 15
h-index: 2
Ron Shprints
Ron Shprints
Citations: 45
h-index: 2

전이 상태(TS)는 화학 반응성과 반응 메커니즘을 이해하고 정량적으로 예측하는 데 핵심적인 역할을 합니다. 기존의 전이 상태 생성 방법은 계산 비용이 많이 들지만, 최근의 생성 모델 접근 방식은 비교적 작은 분자에 대해 화학적으로 의미 있는 전이 상태 예측을 가능하게 했습니다. 그러나 이러한 방법은 분자 크기가 증가함에 따라 발생하는 분포 변화로 인해 실제로 사용되는 반응 기질로 일반화되지 못합니다. 또한, 더 큰 분자에 대한 전이 상태 기하학 정보가 충분히 제공되지 않아, 이러한 분자에 대해 생성 모델을 처음부터 학습시키는 것은 실현 불가능합니다. 이러한 문제점을 해결하기 위해, 우리는 반응 메커니즘을 정의하는 반응성 핵심 원자에 대한 전이 상태 기하학을 예측하는 생성 모델을 학습하는 분할 정복(divide-and-conquer) 접근 방식인 FragmentFlow를 소개합니다. 전체 전이 상태 구조는 예측된 핵심에 치환기 조각을 다시 연결하여 재구성됩니다. FragmentFlow는 반응성 핵심, 즉 분자 맥락에 관계없이 크기와 구성이 비교적 일정하게 유지되는 부분에 대해 작동하여 생성 모델링에서의 분포 변화를 완화합니다. 최대 33개의 무거운 원자를 포함하는 반응물을 포함하는 새로운 큐레이션된 데이터 세트에 대해 평가한 결과, FragmentFlow는 90%의 전이 상태를 정확하게 식별했으며, 기존 초기화 방식에 비해 30% 더 적은 saddle-point 최적화 단계를 필요로 했습니다. 이러한 결과는 고처리량 반응성 연구를 위한 확장 가능한 전이 상태 생성의 가능성을 제시합니다.

Original Abstract

Transition states (TSs) are central to understanding and quantitatively predicting chemical reactivity and reaction mechanisms. Although traditional TS generation methods are computationally expensive, recent generative modeling approaches have enabled chemically meaningful TS prediction for relatively small molecules. However, these methods fail to generalize to practically relevant reaction substrates because of distribution shifts induced by increasing molecular sizes. Furthermore, TS geometries for larger molecules are not available at scale, making it infeasible to train generative models from scratch on such molecules. To address these challenges, we introduce FragmentFlow: a divide-and-conquer approach that trains a generative model to predict TS geometries for the reactive core atoms, which define the reaction mechanism. The full TS structure is then reconstructed by re-attaching substituent fragments to the predicted core. By operating on reactive cores, whose size and composition remain relatively invariant across molecular contexts, FragmentFlow mitigates distribution shifts in generative modeling. Evaluated on a new curated dataset of reactions involving reactants with up to 33 heavy atoms, FragmentFlow correctly identifies 90% of TSs while requiring 30% fewer saddle-point optimization steps than classical initialization schemes. These results point toward scalable TS generation for high-throughput reactivity studies.

0 Citations
0 Influential
30 Altmetric
150.0 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!