MiroFlow: 일반적인 심층 연구 작업을 위한 고성능 및 안정적인 오픈 소스 에이전트 프레임워크
MiroFlow: Towards High-Performance and Robust Open-Source Agent Framework for General Deep Research Tasks
대규모 언어 모델(LLM)의 놀라운 발전에도 불구하고, 실제 복잡한 작업, 특히 외부 도구와의 상호 작용 및 동적 환경이 필요한 작업을 수행할 때, 독립적인 LLM의 성능은 한계에 도달하기 시작했습니다. 최근 에이전트 프레임워크는 도구 통합 및 외부 상호 작용을 통해 모델의 자율성을 향상시키고자 하지만, 여전히 단순한 워크플로우, 불안정한 성능, 다양한 벤치마크 및 작업에 대한 제한적인 지원, 그리고 비용이 많이 드는 상용 API에 대한 과도한 의존 문제를 안고 있습니다. 본 연구에서는 유연한 오케스트레이션을 위한 에이전트 그래프, 성능 향상을 위한 선택적인 심층 추론 모드, 그리고 안정적이고 재현 가능한 성능을 보장하는 견고한 워크플로우 실행을 통합한 고성능 및 안정적인 오픈 소스 에이전트 프레임워크인 MiroFlow를 제안합니다. 광범위한 실험 결과, MiroFlow는 GAIA, BrowseComp-EN/ZH, HLE, xBench-DeepSearch, 그리고 특히 FutureX를 포함한 다양한 에이전트 벤치마크에서 일관되게 최고 수준의 성능을 달성하는 것을 보여줍니다. 우리는 MiroFlow가 심층 연구 커뮤니티를 위한 접근성이 용이하고, 재현 가능하며, 비교 가능한 기준점 역할을 할 수 있기를 바랍니다.
Despite the remarkable progress of large language models (LLMs), the capabilities of standalone LLMs have begun to plateau when tackling real-world, complex tasks that require interaction with external tools and dynamic environments. Although recent agent frameworks aim to enhance model autonomy through tool integration and external interaction, they still suffer from naive workflows, unstable performance, limited support across diverse benchmarks and tasks, and heavy reliance on costly commercial APIs. In this work, we propose a high-performance and robust open-source agent framework, termed MiroFlow, which incorporates an agent graph for flexible orchestration, an optional deep reasoning mode to enhance performance, and a robust workflow execution to ensure stable and reproducible performance. Extensive experiments demonstrate that MiroFlow consistently achieves state-of-the-art performance across multiple agent benchmarks, including GAIA, BrowseComp-EN/ZH, HLE, xBench-DeepSearch, and notably FutureX. We hope it could serve as an easily accessible, reproducible, and comparable baseline for the deep research community.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.