언어 모델 기반 심볼릭 회귀를 통한 재료 내 해석 가능한 물리 법칙 발견
Discovery of Interpretable Physical Laws in Materials via Language-Model-Guided Symbolic Regression
고차원 데이터로부터 해석 가능한 물리 법칙을 발견하는 것은 과학 연구의 근본적인 과제입니다. 전통적인 방법인 심볼릭 회귀는 종종 방대한 가능성 공간을 탐색하는 과정에서 복잡하고 비물리적인 공식을 생성하는 경우가 많습니다. 본 연구에서는 대규모 언어 모델에 내재된 과학적 지식을 활용하여 탐색 과정을 안내하는 프레임워크를 소개하며, 이를 통해 데이터 내에서 물리 법칙을 효율적으로 식별할 수 있도록 합니다. 제안하는 방법론을 검증하기 위해 페로브스카이트 재료의 주요 특성을 모델링했습니다. 우리 방법은 전통적인 심볼릭 회귀에서 흔히 발생하는 조합적 폭발을 완화하여, 효과적인 탐색 공간을 약 $10^5$배 줄입니다. 벌크 모듈러스, 밴드갭, 산소 발생 반응 활성 등에 대한 새로운 공식 세트가 발견되었으며, 이는 의미 있는 물리적 통찰력을 제공할 뿐만 아니라 이전 공식보다 정확성과 단순성 측면에서 우수한 성능을 보입니다.
Discovering interpretable physical laws from high-dimensional data is a fundamental challenge in scientific research. Traditional methods, such as symbolic regression, often produce complex, unphysical formulas when searching a vast space of possible forms. We introduce a framework that guides the search process by leveraging the embedded scientific knowledge of large language models, enabling efficient identification of physical laws in the data. We validate our approach by modeling key properties of perovskite materials. Our method mitigates the combinatorial explosion commonly encountered in traditional symbolic regression, reducing the effective search space by a factor of approximately $10^5$. A set of novel formulas for bulk modulus, band gap, and oxygen evolution reaction activity are identified, which not only provide meaningful physical insights but also outperform previous formulas in accuracy and simplicity.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.