ResearchEVO: 자동화된 과학적 발견 및 문서화를 위한 통합 프레임워크
ResearchEVO: An End-to-End Framework for Automated Scientific Discovery and Documentation
과학적 돌파구에서 반복적으로 나타나는 중요한 패턴은 다음과 같습니다. 첫 번째 단계는 예상치 못한 결과를 산출하는 무방향적 실험 단계이며, 두 번째 단계는 그 결과가 작동하는 이유를 설명하고 기존 이론과의 연관성을 제시하는 후반 단계입니다. 본 논문에서는 이러한 발견-설명 패러다임을 계산적으로 구현하는 통합 프레임워크인 ResearchEVO를 소개합니다. 진화 단계에서는 LLM(Large Language Model) 기반의 2차원 공동 진화를 사용하여 알고리즘 로직과 전체 아키텍처를 동시에 최적화하여, 솔루션에 대한 이해 없이 순수한 적합도 기반으로 코드 구현 공간을 탐색합니다. 작성 단계에서는 가장 성능이 좋은 알고리즘을 선택하고, 문장 수준의 검색 증강 생성(Retrieval-Augmented Generation)을 통해 완전하고 출판 가능한 연구 논문을 자동으로 생성하며, 명시적인 환각 방지 검증 및 자동화된 실험 설계를 포함합니다. 저희가 알고 있는 한, ResearchEVO는 이러한 전체 파이프라인을 처음부터 끝까지 다루는 첫 번째 시스템입니다. 기존 연구에서는 체계적인 알고리즘 진화와 문헌 기반의 과학적 문서화를 동시에 수행한 사례가 없습니다. 저희는 이 프레임워크를 실제 구글 양자 하드웨어 데이터를 활용한 양자 오류 수정 및 물리학 기반 신경망이라는 두 가지 융합 분야의 과학적 문제에 적용하여 검증했습니다. 진화 단계에서는 인간이 이해할 수 있는 알고리즘 메커니즘을 발견했으며, 이는 해당 분야의 기존 문헌에서는 제안되지 않았습니다. 작성 단계에서는 RAG(Retrieval-Augmented Generation)을 사용하여 이러한 발견을 기존 이론과 정확하게 연결하는 컴파일 가능한 LaTeX 원고를 자동으로 생성했으며, 허구적인 인용은 전혀 포함되지 않았습니다.
An important recurring pattern in scientific breakthroughs is a two-stage process: an initial phase of undirected experimentation that yields an unexpected finding, followed by a retrospective phase that explains why the finding works and situates it within existing theory. We present ResearchEVO, an end-to-end framework that computationally instantiates this discover-then-explain paradigm. The Evolution Phase employs LLM-guided bi-dimensional co-evolution -- simultaneously optimizing both algorithmic logic and overall architecture -- to search the space of code implementations purely by fitness, without requiring any understanding of the solutions it produces. The Writing Phase then takes the best-performing algorithm and autonomously generates a complete, publication-ready research paper through sentence-level retrieval-augmented generation with explicit anti-hallucination verification and automated experiment design. To our knowledge, ResearchEVO is the first system to cover this full pipeline end to end: no prior work jointly performs principled algorithm evolution and literature-grounded scientific documentation. We validate the framework on two cross-disciplinary scientific problems -- Quantum Error Correction using real Google quantum hardware data, and Physics-Informed Neural Networks -- where the Evolution Phase discovered human-interpretable algorithmic mechanisms that had not been previously proposed in the respective domain literatures. In both cases, the Writing Phase autonomously produced compilable LaTeX manuscripts that correctly grounded these blind discoveries in existing theory via RAG, with zero fabricated citations.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.