RGAlign-Rec: 추천 시스템에서 잠재적 쿼리 추론을 위한 순위 기반 정렬
RGAlign-Rec: Ranking-Guided Alignment for Latent Query Reasoning in Recommendation Systems
현대적인 전자상거래 챗봇에서 사용자의 행동 및 맥락적 신호를 통해 사용자의 요구를 예측하여 "제로-쿼리" 추천을 가능하게 하는 사전 예측 기능은 매우 중요합니다. 그러나 기존 산업 시스템은 다음과 같은 두 가지 근본적인 문제에 직면해 있습니다. (1) 챗봇의 지식 베이스 내의 의미적 의도와 개별적인 사용자 특징 간의 의미론적 간극, 그리고 (2) 범용 LLM의 출력과 특정 작업에 대한 순위 지표 간의 목표 불일치. 이러한 문제를 해결하기 위해, 우리는 LLM 기반의 의미론적 추론기와 쿼리 강화(QE) 순위 모델을 통합하는 폐루프 정렬 프레임워크인 RGAlign-Rec을 제안합니다. 또한, 다운스트림 순위 신호를 피드백으로 활용하여 LLM의 잠재적 추론을 개선하는 다단계 훈련 패러다임인 순위 기반 정렬(RGA)을 소개합니다. Shopee에서 수집된 대규모 산업 데이터 세트에 대한 광범위한 실험 결과, RGAlign-Rec은 GAUC에서 0.12%의 향상을 달성하여 오류율을 3.52%p 상대적으로 감소시키고, Recall@3을 0.56% 향상시켰습니다. 온라인 A/B 테스트를 통해 우리 프레임워크의 총 효과를 검증한 결과, 쿼리 강화 모델(QE-Rec)은 초기 CTR을 0.98% 향상시켰으며, 이후의 순위 기반 정렬 단계는 추가적으로 0.13%의 향상을 가져왔습니다. 이러한 결과는 순위 인지 정렬이 의미론적 추론과 순위 목표를 효과적으로 동기화하여 실제 프로액티브 추천 시스템의 예측 정확도와 서비스 품질을 크게 향상시킨다는 것을 보여줍니다.
Proactive intent prediction is a critical capability in modern e-commerce chatbots, enabling "zero-query" recommendations by anticipating user needs from behavioral and contextual signals. However, existing industrial systems face two fundamental challenges: (1) the semantic gap between discrete user features and the semantic intents within the chatbot's Knowledge Base, and (2) the objective misalignment between general-purpose LLM outputs and task-specific ranking utilities. To address these issues, we propose RGAlign-Rec, a closed-loop alignment framework that integrates an LLM-based semantic reasoner with a Query-Enhanced (QE) ranking model. We also introduce Ranking-Guided Alignment (RGA), a multi-stage training paradigm that utilizes downstream ranking signals as feedback to refine the LLM's latent reasoning. Extensive experiments on a large-scale industrial dataset from Shopee demonstrate that RGAlign-Rec achieves a 0.12% gain in GAUC, leading to a significant 3.52% relative reduction in error rate, and a 0.56% improvement in Recall@3. Online A/B testing further validates the cumulative effectiveness of our framework: the Query-Enhanced model (QE-Rec) initially yields a 0.98% improvement in CTR, while the subsequent Ranking-Guided Alignment stage contributes an additional 0.13% gain. These results indicate that ranking-aware alignment effectively synchronizes semantic reasoning with ranking objectives, significantly enhancing both prediction accuracy and service quality in real-world proactive recommendation systems.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.