2603.29723v1 Mar 31, 2026 cs.AI

종단 간 역합성 계획을 위한 강화된 추론

Reinforced Reasoning for End-to-End Retrosynthetic Planning

Chenyang Zuo
Chenyang Zuo
Citations: 7
h-index: 1
Siqi Fan
Siqi Fan
Citations: 39
h-index: 2
Yizhen Luo
Yizhen Luo
Citations: 631
h-index: 5
Zaiqing Nie
Zaiqing Nie
Citations: 175
h-index: 8

역합성 계획은 유기 화학 분야의 핵심적인 과제이지만, 조합적 복잡성으로 인해 여전히 어려운 문제로 남아 있습니다. 이러한 문제를 해결하기 위해, 기존 접근 방식은 일반적으로 단일 단계 예측과 외부 검색 휴리스틱을 결합한 하이브리드 프레임워크에 의존하며, 이는 로컬 분자 변환과 글로벌 계획 목표 간의 논리적 일관성을 필연적으로 파괴합니다. 이러한 격차를 해소하고 정교한 전략적 예측을 모델의 화학적 추론에 직접 통합하기 위해, 우리는 종단 간 생성 프레임워크인 ReTriP을 소개합니다. ReTriP은 역합성을 직접적인 Chain-of-Thought 추론 작업으로 재구성합니다. 우리는 경로 일관성을 갖는 분자 표현 방식을 확립하고, 추론 증류에서 검증 가능한 보상을 갖는 강화 학습으로 점진적으로 전환되는 훈련 커리큘럼을 사용하여 단계별 생성과 실제 경로 유용성을 효과적으로 일치시킵니다. RetroBench 데이터셋에 대한 실험적 평가 결과, ReTriP은 최첨단 성능을 달성하며, 하이브리드 기준 모델에 비해 장기적인 계획 수립에서 더 뛰어난 견고성을 보여줍니다.

Original Abstract

Retrosynthetic planning is a fundamental task in organic chemistry, yet remains challenging due to its combinatorial complexity. To address this, conventional approaches typically rely on hybrid frameworks that combine single-step predictions with external search heuristics, inevitably fracturing the logical coherence between local molecular transformations and global planning objectives. To bridge this gap and embed sophisticated strategic foresight directly into the model's chemical reasoning, we introduce ReTriP, an end-to-end generative framework that reformulates retrosynthesis as a direct Chain-of-Thought reasoning task. We establish a path-coherent molecular representation and employ a progressive training curriculum that transitions from reasoning distillation to reinforcement learning with verifiable rewards, effectively aligning stepwise generation with practical route utility. Empirical evaluation on RetroBench demonstrates that ReTriP achieves state-of-the-art performance, exhibiting superior robustness in long-horizon planning compared to hybrid baselines.

0 Citations
0 Influential
4 Altmetric
20.0 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!