2602.02636v1 Feb 02, 2026 cs.CL

WideSeek: 멀티 에이전트 확장을 통한 광범위 연구 발전

WideSeek: Advancing Wide Research via Multi-Agent Scaling

Kun Xu
Kun Xu
Citations: 23
h-index: 2
Ziyang Huang
Ziyang Huang
Citations: 42
h-index: 3
Haolin Ren
Haolin Ren
Citations: 0
h-index: 0
Xiaowei Yuan
Xiaowei Yuan
Citations: 57
h-index: 3
Jiawei Wang
Jiawei Wang
Citations: 4
h-index: 1
Zhongtao Jiang
Zhongtao Jiang
Citations: 207
h-index: 6
Shizhu He
Shizhu He
Citations: 7,774
h-index: 30
Jun Zhao
Jun Zhao
Citations: 1,136
h-index: 12
Kang Liu
Kang Liu
Citations: 259
h-index: 9

정보 검색 기술은 심층 연구(Deep Research)에서 광범위 연구(Wide Research)로 진화하고 있으며, 이는 복잡한 제약 조건 하에서 병렬적으로 포괄적인 정보를 검색하고 통합하는 데 필수적인 패러다임입니다. 그러나 이 분야의 발전은 검색 범위(search breadth)에 대한 전용 벤치마크 및 최적화 방법론의 부족으로 인해 저해되고 있습니다. 이러한 문제점을 해결하기 위해, 우리는 데이터 파이프라인 및 에이전트 최적화라는 두 가지 관점에서 광범위 연구를 심층적으로 분석했습니다. 첫째, 우리는 엄격한 다단계 데이터 파이프라인을 통해 구축된 일반적인 광범위 정보 검색(GBIS) 벤치마크인 WideSeekBench를 개발했습니다. 이 벤치마크는 대상 정보량, 논리적 제약 조건 및 도메인 전반에 걸쳐 다양성을 보장합니다. 둘째, 우리는 작업 요구 사항에 따라 자동으로 병렬 하위 에이전트를 분기할 수 있는 동적 계층적 멀티 에이전트 아키텍처인 WideSeek를 소개합니다. 또한, 우리는 멀티 에이전트의 경로를 선형화하고, 엔드-투-엔드 강화 학습(RL)을 사용하여 시스템을 최적화하는 통합 학습 프레임워크를 설계했습니다. 실험 결과는 WideSeek 및 멀티 에이전트 RL의 효과를 입증하며, 에이전트 수를 늘리는 것이 광범위 연구 패러다임을 발전시키는 유망한 방향임을 강조합니다.

Original Abstract

Search intelligence is evolving from Deep Research to Wide Research, a paradigm essential for retrieving and synthesizing comprehensive information under complex constraints in parallel. However, progress in this field is impeded by the lack of dedicated benchmarks and optimization methodologies for search breadth. To address these challenges, we take a deep dive into Wide Research from two perspectives: Data Pipeline and Agent Optimization. First, we produce WideSeekBench, a General Broad Information Seeking (GBIS) benchmark constructed via a rigorous multi-phase data pipeline to ensure diversity across the target information volume, logical constraints, and domains. Second, we introduce WideSeek, a dynamic hierarchical multi-agent architecture that can autonomously fork parallel sub-agents based on task requirements. Furthermore, we design a unified training framework that linearizes multi-agent trajectories and optimizes the system using end-to-end RL. Experimental results demonstrate the effectiveness of WideSeek and multi-agent RL, highlighting that scaling the number of agents is a promising direction for advancing the Wide Research paradigm.

0 Citations
0 Influential
15 Altmetric
75.0 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!