2603.24422v1 Mar 25, 2026 cs.IR

OneSearch-V2: 잠재적 추론 강화된 자체 증류 생성 검색 프레임워크

OneSearch-V2: The Latent Reasoning Enhanced Self-distillation Generative Search Framework

Han Li
Han Li
Citations: 5
h-index: 1
Zhipeng Qian
Zhipeng Qian
Citations: 62
h-index: 4
Zihan Liang
Zihan Liang
Citations: 41
h-index: 4
Yufei Ma
Yufei Ma
Citations: 77
h-index: 5
Huangyu Dai
Huangyu Dai
Citations: 52
h-index: 4
Chenyi Lei
Chenyi Lei
Citations: 134
h-index: 5
Tong Zhao
Tong Zhao
Citations: 33
h-index: 4
Kun Gai
Kun Gai
Citations: 1,158
h-index: 12
Ben Chen
Ben Chen
Citations: 56
h-index: 4
Siyuan Wang
Siyuan Wang
Citations: 26
h-index: 2
Xuxin Zhang
Xuxin Zhang
Citations: 14
h-index: 1
Yueran Lv
Yueran Lv
Citations: 0
h-index: 0
Ying Yang
Ying Yang
Citations: 25
h-index: 2
Lingtao Mao
Lingtao Mao
Citations: 7
h-index: 2
Xinyu Sun
Xinyu Sun
Citations: 2
h-index: 1
Zhixin Zhai
Zhixin Zhai
Citations: 19
h-index: 2
Yang Zhao
Yang Zhao
Citations: 14
h-index: 2
Bo Liu
Bo Liu
Citations: 11
h-index: 1
Jingshan Lv
Jingshan Lv
Citations: 262
h-index: 3
Xiao Liang
Xiao Liang
Citations: 19
h-index: 2
Hui Kong
Hui Kong
Citations: 11
h-index: 2
Jing Chen
Jing Chen
Citations: 0
h-index: 0
Wenwu Ou
Wenwu Ou
Citations: 107
h-index: 3

생성 검색(Generative Retrieval, GR)은 현대 검색 시스템의 유망한 패러다임으로 떠오르고 있습니다. 다단계 구조에 비해 GR은 엔드 투 엔드 공동 최적화 및 높은 계산 효율성과 같은 장점을 제공합니다. 대표적인 산업 규모의 생성 검색 프레임워크인 OneSearch는 상당한 상업적 및 운영적 이점을 가져왔습니다. 그러나 OneSearch는 복잡한 쿼리에 대한 이해 부족, 잠재적인 사용자 의도를 비효율적으로 활용하고, 제한적인 과거 선호도에 대한 과적합으로 인해 성능 향상에 한계가 있었습니다. 이러한 문제점을 해결하기 위해, 우리는 잠재적 추론을 강화하는 자체 증류 생성 검색 프레임워크인 **OneSearch-V2**를 제안합니다. OneSearch-V2는 세 가지 주요 혁신을 포함합니다: (1) 심층적인 쿼리 이해를 가능하게 하고 직접 추론의 표면적인 의미 매칭 한계를 극복하는 사고 증강 복합 쿼리 이해 모듈, (2) 암묵적인 문맥 학습을 통해 로그 데이터에만 의존하지 않고 사용자의 잠재적이고 정확한 전자 상거래 의도를 파악하는 추론 기반 자체 증류 학습 파이프라인, (3) 단일 전환 지표에서 발생하는 보상 해킹을 완화하고, 직접적인 사용자 피드백을 통해 개인 선호도를 반영하는 행동 선호도 정렬 최적화 시스템. 광범위한 오프라인 평가 결과, OneSearch-V2는 강력한 쿼리 인식 및 사용자 프로파일링 능력을 보여주었습니다. 온라인 A/B 테스트를 통해 비즈니스 효과가 더욱 검증되었으며, 아이템 클릭률(CTR)이 +3.98%, 구매 전환율이 +3.05%, 주문량이 +2.11% 증가했습니다. 수동 평가를 통해 검색 경험 품질이 향상되었으며, 페이지 품질 지수가 +1.65%, 쿼리-아이템 관련성이 +1.37% 증가했습니다. 더욱 중요한 점은 OneSearch-V2가 정보 필터 버블 및 장기 미사용 데이터 희소성과 같은 일반적인 검색 시스템 문제를 추가적인 추론 비용이나 서비스 지연 없이 효과적으로 완화합니다.

Original Abstract

Generative Retrieval (GR) has emerged as a promising paradigm for modern search systems. Compared to multi-stage cascaded architecture, it offers advantages such as end-to-end joint optimization and high computational efficiency. OneSearch, as a representative industrial-scale deployed generative search framework, has brought significant commercial and operational benefits. However, its inadequate understanding of complex queries, inefficient exploitation of latent user intents, and overfitting to narrow historical preferences have limited its further performance improvement. To address these challenges, we propose \textbf{OneSearch-V2}, a latent reasoning enhanced self-distillation generative search framework. It contains three key innovations: (1) a thought-augmented complex query understanding module, which enables deep query understanding and overcomes the shallow semantic matching limitations of direct inference; (2) a reasoning-internalized self-distillation training pipeline, which uncovers users' potential yet precise e-commerce intentions beyond log-fitting through implicit in-context learning; (3) a behavior preference alignment optimization system, which mitigates reward hacking arising from the single conversion metric, and addresses personal preference via direct user feedback. Extensive offline evaluations demonstrate OneSearch-V2's strong query recognition and user profiling capabilities. Online A/B tests further validate its business effectiveness, yielding +3.98\% item CTR, +3.05\% buyer conversion rate, and +2.11\% order volume. Manual evaluation further confirms gains in search experience quality, with +1.65\% in page good rate and +1.37\% in query-item relevance. More importantly, OneSearch-V2 effectively mitigates common search system issues such as information bubbles and long-tail sparsity, without incurring additional inference costs or serving latency.

1 Citations
0 Influential
6 Altmetric
31.0 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!