ASI-Evolve: 인공지능이 인공지능을 가속화하다
ASI-Evolve: AI Accelerates AI
인공지능이 스스로의 발전을 가속화할 수 있을까요? 최근의 에이전트 기반 시스템들은 명확하게 정의된 작업에서 빠른 피드백을 통해 뛰어난 성능을 보여주었지만, 실제 인공지능 발전의 원동력이 되는 비용이 많이 들고, 장기적인 관점에서 진행되며, 약하게 감독되는 연구 프로세스를 처리할 수 있는지 여부는 불분명합니다. 본 논문에서는 AI-for-AI 연구를 위한 에이전트 기반 프레임워크인 ASI-Evolve를 소개합니다. ASI-Evolve는 학습-설계-실험-분석 사이클을 통해 이러한 연구 프로세스를 자동화합니다. ASI-Evolve는 표준 진화 에이전트에 두 가지 핵심 요소를 추가합니다. 첫째, 축적된 인간의 지식을 탐색 과정에 주입하는 인지 기반(cognition base)이고, 둘째, 복잡한 실험 결과를 재사용 가능한 통찰력으로 추출하는 전용 분석기(analyzer)입니다. ASI-Evolve는 인공지능 개발의 세 가지 핵심 요소(데이터, 아키텍처, 학습 알고리즘)에 걸쳐 AI 기반의 발견을 가능하게 하는 최초의 통합 프레임워크입니다. 신경망 아키텍처 설계 분야에서 ASI-Evolve는 105개의 최첨단(SOTA) 선형 어텐션 아키텍처를 발견했으며, 가장 우수한 모델은 DeltaNet보다 +0.97점이 더 높은 성능을 보였습니다. 사전 훈련 데이터 큐레이션 분야에서는 진화된 파이프라인이 평균 벤치마크 성능을 +3.96점 향상시켰으며, MMLU에서는 18점이 넘는 성능 향상을 보였습니다. 강화 학습 알고리즘 설계 분야에서는 발견된 알고리즘이 GRPO보다 AMC32에서 최대 +12.5점, AIME24에서 +11.67점, OlympiadBench에서 +5.04점 더 높은 성능을 보였습니다. 또한, 본 연구는 이러한 AI-for-AI 패러다임이 AI 시스템 자체를 넘어 수학 및 생의학 분야에서도 적용될 수 있다는 초기 증거를 제시합니다. 이러한 결과들은 ASI-Evolve가 인공지능 개발의 초기 단계에서 인공지능이 스스로를 가속화할 수 있도록 하는 유망한 방법이며, 폐쇄 루프 AI 연구의 실현 가능성에 대한 초기 증거를 제공한다는 것을 시사합니다.
Can AI accelerate the development of AI itself? While recent agentic systems have shown strong performance on well-scoped tasks with rapid feedback, it remains unclear whether they can tackle the costly, long-horizon, and weakly supervised research loops that drive real AI progress. We present ASI-Evolve, an agentic framework for AI-for-AI research that closes this loop through a learn-design-experiment-analyze cycle. ASI-Evolve augments standard evolutionary agents with two key components: a cognition base that injects accumulated human priors into each round of exploration, and a dedicated analyzer that distills complex experimental outcomes into reusable insights for future iterations. To our knowledge, ASI-Evolve is the first unified framework to demonstrate AI-driven discovery across three central components of AI development: data, architectures, and learning algorithms. In neural architecture design, it discovered 105 SOTA linear attention architectures, with the best discovered model surpassing DeltaNet by +0.97 points, nearly 3x the gain of recent human-designed improvements. In pretraining data curation, the evolved pipeline improves average benchmark performance by +3.96 points, with gains exceeding 18 points on MMLU. In reinforcement learning algorithm design, discovered algorithms outperform GRPO by up to +12.5 points on AMC32, +11.67 points on AIME24, and +5.04 points on OlympiadBench. We further provide initial evidence that this AI-for-AI paradigm can transfer beyond the AI stack through experiments in mathematics and biomedicine. Together, these results suggest that ASI-Evolve represents a promising step toward enabling AI to accelerate AI across the foundational stages of development, offering early evidence for the feasibility of closed-loop AI research.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.