SciDER: 과학 데이터 중심의 통합 연구 시스템
SciDER: Scientific Data-centric End-to-end Researcher
대규모 언어 모델을 활용한 자동화된 과학적 발견은 아이디어 구상부터 실험까지 연구 전반에 걸쳐 혁신을 가져오고 있지만, 기존의 에이전트들은 과학 실험에서 수집된 원시 데이터를 자율적으로 처리하는 데 어려움을 겪고 있습니다. 본 연구에서는 데이터 중심의 통합 시스템인 SciDER를 소개합니다. SciDER는 기존 프레임워크와 달리, 특화된 에이전트들이 협력하여 원시 과학 데이터를 분석하고, 특정 데이터의 특징에 기반한 가설 및 실험 설계를 생성하며, 이에 상응하는 코드를 작성하고 실행합니다. 세 가지 벤치마크 테스트 결과, SciDER는 특화된 데이터 기반 과학적 발견 분야에서 뛰어난 성능을 보이며, 자체적으로 진화하는 메모리와 비평 기반 피드백 루프를 통해 범용 에이전트 및 최첨단 모델보다 우수한 성능을 나타냅니다. SciDER는 모듈화된 파이썬 패키지로 배포되며, 사용하기 쉬운 PyPI 패키지와 경량 웹 인터페이스를 제공하여 자율적이고 데이터 기반의 연구를 가속화하고, 모든 연구자와 개발자에게 접근 가능하도록 설계되었습니다.
Automated scientific discovery with large language models is transforming the research lifecycle from ideation to experimentation, yet existing agents struggle to autonomously process raw data collected from scientific experiments. We introduce SciDER, a data-centric end-to-end system that automates the research lifecycle. Unlike traditional frameworks, our specialized agents collaboratively parse and analyze raw scientific data, generate hypotheses and experimental designs grounded in specific data characteristics, and write and execute corresponding code. Evaluation on three benchmarks shows SciDER excels in specialized data-driven scientific discovery and outperforms general-purpose agents and state-of-the-art models through its self-evolving memory and critic-led feedback loop. Distributed as a modular Python package, we also provide easy-to-use PyPI packages with a lightweight web interface to accelerate autonomous, data-driven research and aim to be accessible to all researchers and developers.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.