Logos: 진화 가능한 추론 엔진을 이용한 합리적인 분자 설계
Logos: An evolvable reasoning engine for rational molecular design
기능성 분자의 발견 및 설계는 화학, 생물학, 재료 과학 분야에서 핵심적인 과제입니다. 최근 머신 러닝의 발전은 분자 특성 예측 및 후보 물질 생성 속도를 가속화했지만, 기존 모델은 물리적 정확도 또는 유연한 추론 능력 중 어느 한 가지에 특화되는 경향이 있으며, 투명한 추론 능력이나 화학적 타당성을 보장하지 못하는 경우가 많습니다. 이러한 불균형은 실제 과학적 설계 워크플로우에서 인공 지능 시스템의 신뢰성을 제한합니다. 본 연구에서는 다단계 논리적 추론과 엄격한 화학적 일관성을 통합한 소형 분자 추론 모델인 Logos를 제시합니다. Logos는 모델에 분자 설명과 구조적 결정 간의 명시적 추론 예제를 먼저 학습시키고, 이후 점진적으로 이러한 추론 패턴을 분자 표현과 일치시키는 단계적 전략을 사용하여 학습됩니다. 마지막 학습 단계에서는 화학 규칙 및 불변량이 최적화 목표에 직접 통합되어 모델이 화학적으로 타당한 결과를 생성하도록 유도합니다. 다양한 벤치마크 데이터 세트에서 Logos는 구조적 정확성과 화학적 타당성 모두에서 뛰어난 성능을 보이며, 훨씬 더 큰 범용 언어 모델과 비교하여 상당한 파라미터 수를 줄이면서도 동등하거나 더 나은 성능을 달성합니다. 벤치마크 평가 외에도, Logos는 여러 가지 잠재적으로 충돌하는 제약 조건을 포함하는 분자 최적화 작업에서 안정적인 성능을 보입니다. Logos는 중간 추론 단계를 명시적으로 보여줌으로써, 생성된 각 구조의 설계 논리에 대한 인간의 검토 및 평가를 가능하게 합니다. 이러한 결과는 추론 구조와 물리적 일관성을 동시에 최적화하는 것이 분자 과학 분야에서 신뢰할 수 있고 해석 가능한 인공 지능 시스템을 개발하는 실용적인 방법을 제공하며, 인공 지능을 과학적 발견 과정에 더욱 긴밀하게 통합하는 데 기여할 수 있음을 시사합니다.
The discovery and design of functional molecules remain central challenges across chemistry,biology, and materials science. While recent advances in machine learning have accelerated molecular property prediction and candidate generation, existing models tend to excel either in physical fidelity without transparent reasoning, or in flexible reasoning without guarantees of chemical validity. This imbalance limits the reliability of artificial intelligence systems in real scientific design workflows.Here we present Logos, a compact molecular reasoning model that integrates multi-step logical reasoning with strict chemical consistency. Logos is trained using a staged strategy that first exposes the model to explicit reasoning examples linking molecular descriptions to structural decisions, and then progressively aligns these reasoning patterns with molecular representations. In a final training phase, chemical rules and invariants are incorporated directly into the optimization objective, guiding the model toward chemically valid outputs. Across multiple benchmark datasets, Logos achieves strong performance in both structural accuracy and chemical validity, matching or surpassing substantially larger general-purpose language models while operating with a fraction of their parameters. Beyond benchmark evaluation, the model exhibits stable behaviour in molecular optimization tasks involving multiple, potentially conflicting constraints. By explicitly exposing intermediate reasoning steps, Logos enables human inspection and assessment of the design logic underlying each generated structure. These results indicate that jointly optimizing for reasoning structure and physical consistency offers a practical pathway toward reliable and interpretable AI systems for molecular science, supporting closer integration of artificial intelligence into scientific discovery processes.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.