2603.01801v1 Mar 02, 2026 cs.AI

논문이 알려주지 않는 것들: 자동 논문 재현을 위한 암묵적 지식 복구

What Papers Don't Tell You: Recovering Tacit Knowledge for Automated Paper Reproduction

Tong Zhang
Tong Zhang
Citations: 36
h-index: 3
Yuyao Wang
Yuyao Wang
Citations: 5
h-index: 1
Haochen Song
Haochen Song
Citations: 6
h-index: 2
Yaoxin Mao
Yaoxin Mao
Citations: 4
h-index: 2
Jieping Ye
Jieping Ye
Citations: 88
h-index: 1
Chengqi Zhang
Chengqi Zhang
Citations: 70
h-index: 5
Lehui Li
Lehui Li
Citations: 2
h-index: 1
Ruining Wang
Ruining Wang
Citations: 1
h-index: 1
Jiayi Fan
Jiayi Fan
Citations: 0
h-index: 0
Yitong Zhang
Yitong Zhang
Citations: 39
h-index: 2
Yongshun Gong
Yongshun Gong
Citations: 1
h-index: 1

자동 논문 재현, 즉 학술 논문에서 실행 가능한 코드를 생성하는 것은 정보 검색의 문제라기보다는 논문이 필연적으로 내포하는 암묵적 지식 때문에 어려움을 겪습니다. 본 연구에서는 이러한 문제를 세 가지 유형의 암묵적 지식(관계적 지식, 신체적 지식, 집단적 지식)을 점진적으로 복구하는 것으로 공식화하고, 각 유형의 지식을 복구하기 위한 전용 메커니즘을 갖춘 그래프 기반 에이전트 프레임워크인 exttt{method}를 제안합니다. exttt{method}는 노드 수준의 관계 인식 집계를 통해 대상 논문과 인용 문헌 간의 구현 단위 수준의 재사용 및 적응 관계를 분석하여 관계적 지식을 복구하고, 실행 피드백 개선을 통해 런타임 신호에 의해 구동되는 반복적인 디버깅을 통해 신체적 지식을 복구하며, 그래프 수준의 지식 유도를 통해 유사한 구현을 공유하는 논문 클러스터에서 집단적 지식을 추출합니다. 3개의 도메인, 10개의 작업, 40개의 최신 논문을 포함하는 확장된 ReproduceBench 데이터셋에서, exttt{method}는 공식 구현과의 평균 성능 격차를 10.04% 줄였으며, 가장 강력한 기준 모델보다 24.68% 향상된 성능을 보였습니다. 코드는 채택 결정 후 공개될 예정이며, 최종 버전에서 저장소 링크를 제공할 것입니다.

Original Abstract

Automated paper reproduction -- generating executable code from academic papers -- is bottlenecked not by information retrieval but by the tacit knowledge that papers inevitably leave implicit. We formalize this challenge as the progressive recovery of three types of tacit knowledge -- relational, somatic, and collective -- and propose \method, a graph-based agent framework with a dedicated mechanism for each: node-level relation-aware aggregation recovers relational knowledge by analyzing implementation-unit-level reuse and adaptation relationships between the target paper and its citation neighbors; execution-feedback refinement recovers somatic knowledge through iterative debugging driven by runtime signals; and graph-level knowledge induction distills collective knowledge from clusters of papers sharing similar implementations. On an extended ReproduceBench spanning 3 domains, 10 tasks, and 40 recent papers, \method{} achieves an average performance gap of 10.04\% against official implementations, improving over the strongest baseline by 24.68\%. The code will be publicly released upon acceptance; the repository link will be provided in the final version.

0 Citations
0 Influential
2.5 Altmetric
12.5 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!