2602.13704v1 Feb 14, 2026 cs.IR

Pailitao-VL: 실시간 다중 모드 산업 검색을 위한 통합 임베딩 및 재순위화 모델

Pailitao-VL: Unified Embedding and Reranker for Real-Time Multi-Modal Industrial Search

Bo Zheng
Bo Zheng
Citations: 113
h-index: 3
Chen Ju
Chen Ju
Citations: 133
h-index: 6
Xu Chen
Xu Chen
Citations: 48
h-index: 3
Zhicheng Wang
Zhicheng Wang
Citations: 2,041
h-index: 2
Yuheng Jiao
Yuheng Jiao
Citations: 3
h-index: 1
Hongfeng Zhan
Hongfeng Zhan
Citations: 14
h-index: 1
Zhaoyan Li
Zhaoyan Li
Citations: 23
h-index: 3
Shihao Xu
Shihao Xu
Citations: 33
h-index: 3
Zhixian Zhao
Zhixian Zhao
Citations: 2
h-index: 1
Tong Jia
Tong Jia
Citations: 3
h-index: 1
Jinsong Lan
Jinsong Lan
Citations: 140
h-index: 6
Xiaoyong Zhu
Xiaoyong Zhu
Citations: 6
h-index: 2
Lei Chen
Lei Chen
Citations: 35
h-index: 3
Lin Li
Lin Li
Citations: 0
h-index: 0
Yuan Gao
Yuan Gao
Citations: 2
h-index: 1
Jun Song
Jun Song
Citations: 114
h-index: 5

본 연구에서는 고정밀, 실시간 산업 검색을 위해 설계된 다중 모드 검색 시스템인 Pailitao-VL을 제안합니다. 우리는 현재 최첨단 솔루션에서 발생하는 세 가지 주요 과제, 즉 불충분한 검색 세분화, 환경 노이즈에 대한 취약성, 그리고 비효율적인 성능 격차 문제를 해결하고자 합니다. 우리의 주요 기여는 두 가지 근본적인 패러다임 전환에 있습니다. 첫째, 임베딩 방식을 기존의 대비 학습에서 절대적인 ID 인식 작업으로 전환했습니다. 수십억 개의 의미 프로토타입으로 정의된 전역적으로 일관된 잠재 공간에 인스턴스를 고정함으로써, 기존 임베딩 솔루션에 내재된 확률적 특성과 세분화 문제를 성공적으로 극복했습니다. 둘째, 생성적 재순위화 모델을 개별적인 점 평가에서 비교 및 교정 기반의 목록 정책으로 발전시켰습니다. 청크 기반의 비교 추론과 교정된 절대적인 관련성 점수를 결합함으로써, 시스템은 미묘한 차별화 능력을 달성하면서 기존 재순위화 방법에서 일반적으로 발생하는 높은 지연 시간을 피할 수 있습니다. 광범위한 오프라인 벤치마크 및 알리바바 전자 상거래 플랫폼에서의 온라인 A/B 테스트 결과, Pailitao-VL은 최첨단 성능을 달성하며 상당한 비즈니스 영향을 미치는 것으로 확인되었습니다. 본 연구는 까다롭고 대규모 생산 환경에 고급 MLLM 기반 검색 아키텍처를 배포하기 위한 견고하고 확장 가능한 방법을 제시합니다.

Original Abstract

In this work, we presented Pailitao-VL, a comprehensive multi-modal retrieval system engineered for high-precision, real-time industrial search. We here address three critical challenges in the current SOTA solution: insufficient retrieval granularity, vulnerability to environmental noise, and prohibitive efficiency-performance gap. Our primary contribution lies in two fundamental paradigm shifts. First, we transitioned the embedding paradigm from traditional contrastive learning to an absolute ID-recognition task. Through anchoring instances to a globally consistent latent space defined by billions of semantic prototypes, we successfully overcome the stochasticity and granularity bottlenecks inherent in existing embedding solutions. Second, we evolved the generative reranker from isolated pointwise evaluation to the compare-and-calibrate listwise policy. By synergizing chunk-based comparative reasoning with calibrated absolute relevance scoring, the system achieves nuanced discriminative resolution while circumventing the prohibitive latency typically associated with conventional reranking methods. Extensive offline benchmarks and online A/B tests on Alibaba e-commerce platform confirm that Pailitao-VL achieves state-of-the-art performance and delivers substantial business impact. This work demonstrates a robust and scalable path for deploying advanced MLLM-based retrieval architectures in demanding, large-scale production environments.

0 Citations
0 Influential
3 Altmetric
15.0 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!