InternAgent-1.5: 장기 자율 과학 발견을 위한 통합 에이전트 프레임워크
InternAgent-1.5: A Unified Agentic Framework for Long-Horizon Autonomous Scientific Discovery
우리는 계산 및 실증 영역 전반에 걸친 엔드투엔드 과학 발견을 위해 설계된 통합 시스템인 InternAgent-1.5를 소개합니다. 이 시스템은 생성, 검증, 진화라는 세 가지 조정된 하위 시스템으로 구성된 구조화된 아키텍처를 기반으로 합니다. 이러한 하위 시스템들은 심층 연구, 솔루션 최적화, 장기 기억(long horizon memory)을 위한 기반 능력에 의해 지원됩니다. 이 아키텍처를 통해 InternAgent-1.5는 일관되고 발전하는 행동을 유지하면서 확장된 발견 주기 동안 지속적으로 작동할 수 있습니다. 또한 단일 통합 시스템 내에서 계산 모델링과 실험실 실험을 조정할 수 있게 합니다. 우리는 GAIA, HLE, GPQA, FrontierScience와 같은 과학적 추론 벤치마크에서 InternAgent-1.5를 평가했으며, 이 시스템은 강력한 기반 능력을 입증하는 선도적인 성능을 달성했습니다. 이러한 벤치마크를 넘어, 우리는 두 가지 범주의 발견 과제를 추가로 평가했습니다. 알고리즘 발견 과제에서 InternAgent-1.5는 핵심 머신 러닝 문제를 위한 경쟁력 있는 방법론을 자율적으로 설계합니다. 실증적 발견 과제에서는 완전한 계산 실험 또는 습식 실험(wet lab)을 수행하고 지구, 생명, 생물 및 물리 영역에서 과학적 발견을 도출합니다. 전반적으로 이러한 결과는 InternAgent-1.5가 자율 과학 발견을 위한 일반적이고 확장 가능한 프레임워크를 제공함을 보여줍니다.
We introduce InternAgent-1.5, a unified system designed for end-to-end scientific discovery across computational and empirical domains. The system is built on a structured architecture composed of three coordinated subsystems for generation, verification, and evolution. These subsystems are supported by foundational capabilities for deep research, solution optimization, and long horizon memory. The architecture allows InternAgent-1.5 to operate continuously across extended discovery cycles while maintaining coherent and improving behavior. It also enables the system to coordinate computational modeling and laboratory experimentation within a single unified system. We evaluate InternAgent-1.5 on scientific reasoning benchmarks such as GAIA, HLE, GPQA, and FrontierScience, and the system achieves leading performance that demonstrates strong foundational capabilities. Beyond these benchmarks, we further assess two categories of discovery tasks. In algorithm discovery tasks, InternAgent-1.5 autonomously designs competitive methods for core machine learning problems. In empirical discovery tasks, it executes complete computational or wet lab experiments and produces scientific findings in earth, life, biological, and physical domains. Overall, these results show that InternAgent-1.5 provides a general and scalable framework for autonomous scientific discovery.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.