SKILLFOUNDRY: 이기종 과학 자원으로부터 자기 진화하는 에이전트 기술 라이브러리 구축
SKILLFOUNDRY: Building Self-Evolving Agent Skill Libraries from Heterogeneous Scientific Resources
현대의 과학 생태계는 저장소, API, 스크립트, 노트북, 문서, 데이터베이스 및 논문 등 다양한 형태로 방대한 절차적 지식을 포함하고 있지만, 이러한 지식은 에이전트가 쉽게 활용할 수 없는 이기종 형태로 분산되어 있습니다. 풍부한 과학적 지식과 실제로 사용 가능한 에이전트 기능 간의 이러한 간극은 효과적인 과학 에이전트 개발의 주요 병목 현상입니다. 본 논문에서는 SkillFoundry를 제안합니다. SkillFoundry는 이러한 자원을 검증된 에이전트 기술로 변환하는 자기 진화 프레임워크로, 작업 범위, 입력 및 출력, 실행 단계, 환경 가정, 출처 및 테스트를 포함하는 재사용 가능한 패키지를 생성합니다. SkillFoundry는 목표 도메인을 지식 트리로 구성하고, 고가치 브랜치에서 자원을 추출하여, 실행 가능한 계약을 정의하고, 이를 실행 가능한 기술 패키지로 컴파일한 다음, 폐쇄 루프 검증 프로세스를 통해 해당 라이브러리를 반복적으로 확장, 수정, 병합 또는 제거합니다. SkillFoundry는 기존의 SkillHub 및 SkillSMP와 같은 기술 라이브러리와 71.1%의 기술이 다른, 새롭고 내부적으로 유효한 기술 라이브러리를 생성합니다. MoSciBench 데이터 세트 중 6개 중 5개에서 이러한 추출된 기술이 코딩 에이전트의 성능을 향상시킨다는 것을 입증했습니다. 또한, SkillFoundry가 특정 과학적 목표에 따라 새로운 작업별 기술을 필요에 따라 설계할 수 있으며, 이러한 기술이 세포 유형 분류 및 scDRS 워크플로우와 같은 두 가지 어려운 유전체 작업에서 성능을 크게 향상시킨다는 것을 보여줍니다. 이러한 결과는 자동으로 추출된 기술이 벤치마크 및 도메인별 작업에서 에이전트 성능을 향상시키고, 수동으로 제작된 기술 라이브러리의 범위를 확장하며, 더욱 강력한 과학 에이전트를 위한 실질적인 기반을 제공한다는 것을 보여줍니다.
Modern scientific ecosystems are rich in procedural knowledge across repositories, APIs, scripts, notebooks, documentation, databases, and papers, yet much of this knowledge remains fragmented across heterogeneous artifacts that agents cannot readily operationalize. This gap between abundant scientific know-how and usable agent capabilities is a key bottleneck for building effective scientific agents. We present SkillFoundry, a self-evolving framework that converts such resources into validated agent skills, reusable packages that encode task scope, inputs and outputs, execution steps, environment assumptions, provenance, and tests. SkillFoundry organizes a target domain as a domain knowledge tree, mines resources from high-value branches, extracts operational contracts, compiles them into executable skill packages, and then iteratively expands, repairs, merges, or prunes the resulting library through a closed-loop validation process. SkillFoundry produces a substantially novel and internally valid skill library, with 71.1\% of mined skills differing from existing skill libraries such as SkillHub and SkillSMP. We demonstrate that these mined skills improve coding agent performance on five of the six MoSciBench datasets. We further show that SkillFoundry can design new task-specific skills on demand for concrete scientific objectives, and that the resulting skills substantially improve performance on two challenging genomics tasks: cell type annotation and the scDRS workflow. Together, these results show that automatically mined skills improve agent performance on benchmarks and domain-specific tasks, expand coverage beyond hand-crafted skill libraries, and provide a practical foundation for more capable scientific agents.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.