2604.28158v1 Apr 30, 2026 cs.AI

Intern-Atlas: 연구 인프라로서의 방법론 진화 그래프 - 인공지능 연구자를 위한 방법론

Intern-Atlas: A Methodological Evolution Graph as Research Infrastructure for AI Scientists

Conghui He
Conghui He
Citations: 315
h-index: 9
Jingxuan Wei
Jingxuan Wei
Citations: 371
h-index: 12
Siyuan Li
Siyuan Li
Citations: 4
h-index: 1
Yumou Liu
Yumou Liu
Citations: 22
h-index: 2
Jintao Chen
Jintao Chen
Citations: 607
h-index: 3
Cheng Tan
Cheng Tan
Citations: 3
h-index: 1
Xuanhe Zhou
Xuanhe Zhou
Citations: 0
h-index: 0
Yujun Wu
Yujun Wu
Citations: 12
h-index: 3
Dongxu Zhang
Dongxu Zhang
Citations: 11
h-index: 1
Xinchen Li
Xinchen Li
Citations: 21
h-index: 2
Jinhang Xu
Jinhang Xu
Citations: 7
h-index: 1
Yiling Duan
Yiling Duan
Citations: 10
h-index: 2
Jia Pan
Jia Pan
Citations: 5
h-index: 2

기존의 연구 인프라는 기본적으로 문서 중심이며, 논문 간의 인용 링크를 제공하지만, 방법론의 진화 과정을 명시적으로 나타내지 못합니다. 특히, 연구 방법이 어떻게, 왜 등장하고, 어떻게 적응하며, 서로 발전하는지에 대한 구조적인 관계를 파악하지 못합니다. 인공지능 기반 연구 에이전트가 과학적 지식을 소비하는 새로운 주체로 부상하면서, 이러한 한계는 더욱 중요해지고 있습니다. 왜냐하면 이러한 에이전트는 비정형 텍스트로부터 방법론 진화의 구조를 신뢰성 있게 재구성할 수 없기 때문입니다. 본 연구에서는 방법론 수준의 개체(entity)를 자동으로 식별하고, 방법론 간의 계통 관계를 추론하며, 연속적인 혁신 간의 전환을 유발하는 병목 현상을 파악하는 방법론 진화 그래프인 Intern-Atlas를 소개합니다. Intern-Atlas는 인공지능 관련 학회, 저널, arXiv 프리프린트를 포함한 1,030,314개의 논문을 기반으로 구축되었으며, 9,410,201개의 의미론적으로 유형화된 연결(edge)로 구성되어 있으며, 각 연결은 정확한 출처 증거에 기반하여 방법론 개발의 질의 가능한 인과 네트워크를 형성합니다. 이러한 구조를 활용하기 위해, 시간 순서에 따른 트리 검색 알고리즘을 제안하여, 방법론의 시간 경과에 따른 발전 과정을 추적하는 진화 사슬을 구성합니다. 생성된 그래프의 품질을 전문가가 선별한 진화 사슬과 비교한 결과, 높은 일치도를 확인했습니다. 또한, Intern-Atlas가 아이디어 평가 및 자동 아이디어 생성과 같은 후속 응용 분야에 활용될 수 있음을 보여줍니다. 본 연구는 방법론 진화 그래프를, 새로운 자동화된 과학적 발견을 위한 기본적인 데이터 계층으로 제시합니다.

Original Abstract

Existing research infrastructure is fundamentally document-centric, providing citation links between papers but lacking explicit representations of methodological evolution. In particular, it does not capture the structured relationships that explain how and why research methods emerge, adapt, and build upon one another. With the rise of AI-driven research agents as a new class of consumers of scientific knowledge, this limitation becomes increasingly consequential, as such agents cannot reliably reconstruct method evolution topologies from unstructured text. We introduce Intern-Atlas, a methodological evolution graph that automatically identifies method-level entities, infers lineage relationships among methodologies, and captures the bottlenecks that drive transitions between successive innovations. Built from 1,030,314 papers spanning AI conferences, journals, and arXiv preprints, the resulting graph comprises 9,410,201 semantically typed edges, each grounded in verbatim source evidence, forming a queryable causal network of methodological development. To operationalize this structure, we further propose a self-guided temporal tree search algorithm for constructing evolution chains that trace the progression of methods over time. We evaluate the quality of the resulting graph against expert-curated ground-truth evolution chains and observe strong alignment. In addition, we demonstrate that Intern-Atlas enables downstream applications in idea evaluation and automated idea generation. We position methodological evolution graphs as a foundational data layer for the emerging automated scientific discovery.

0 Citations
0 Influential
6 Altmetric
30.0 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!