MemRerank: 개인 맞춤형 상품 재순위를 위한 선호도 기억 모델
MemRerank: Preference Memory for Personalized Product Reranking
LLM 기반 쇼핑 에이전트는 개인화 작업을 위해 사용자의 구매 기록 및 다중 턴 상호작용에 의존하지만, 원시 데이터를 그대로 프롬프트에 추가하는 방식은 종종 노이즈, 길이, 관련성 불일치 등으로 인해 효과적이지 않습니다. 본 논문에서는 개인 맞춤형 상품 재순위를 위한 선호도 기억 프레임워크인 MemRerank를 제안합니다. MemRerank는 사용자의 구매 기록을 간결하고 쿼리 독립적인 신호로 추출하여 사용합니다. 본 연구에서는 LLM 기반의 1-in-5 선택 작업을 중심으로 하는 엔드투엔드 벤치마크 및 평가 프레임워크를 구축하여, 기억의 품질과 다운스트림 재순위 성능을 측정합니다. 또한, 다운스트림 재순위 성능을 지도 신호로 사용하여 강화 학습(RL)을 통해 기억 추출기를 훈련합니다. 두 가지 LLM 기반 재순위 모델을 사용하여 실험한 결과, MemRerank는 기억 모델을 사용하지 않거나, 원시 데이터를 사용하거나, 기존의 기억 모델에 비해 일관되게 우수한 성능을 보였습니다. 특히, 1-in-5 정확도에서 최대 +10.61의 절대적인 성능 향상을 달성했습니다. 이러한 결과는 명시적인 선호도 기억이 에이전트 기반의 전자 상거래 시스템에서 개인화를 위한 실용적이고 효과적인 구성 요소임을 시사합니다.
LLM-based shopping agents increasingly rely on long purchase histories and multi-turn interactions for personalization, yet naively appending raw history to prompts is often ineffective due to noise, length, and relevance mismatch. We propose MemRerank, a preference memory framework that distills user purchase history into concise, query-independent signals for personalized product reranking. To study this problem, we build an end-to-end benchmark and evaluation framework centered on an LLM-based \textbf{1-in-5} selection task, which measures both memory quality and downstream reranking utility. We further train the memory extractor with reinforcement learning (RL), using downstream reranking performance as supervision. Experiments with two LLM-based rerankers show that MemRerank consistently outperforms no-memory, raw-history, and off-the-shelf memory baselines, yielding up to \textbf{+10.61} absolute points in 1-in-5 accuracy. These results suggest that explicit preference memory is a practical and effective building block for personalization in agentic e-commerce systems.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.