2605.07129v1 May 08, 2026 cs.IR

RRCM: 순위 기반 정보 검색 기술을 활용한 협업 및 메타 정보 기반 LLM 추천 시스템

RRCM: Ranking-Driven Retrieval over Collaborative and Meta Memories for LLM Recommendation

Wooseong Yang
Wooseong Yang
Citations: 72
h-index: 4
Yu Wang
Yu Wang
Citations: 14
h-index: 1
Shijun Li
Shijun Li
Citations: 2
h-index: 1
Tianxin Wei
Tianxin Wei
Citations: 161
h-index: 4
Joydeep Ghosh
Joydeep Ghosh
Citations: 73
h-index: 3

대규모 언어 모델(LLM)은 강력한 의미론적 이해 능력과 자연어 추론 능력을 바탕으로 차세대 추천 시스템의 유망한 패러다임으로 부상하고 있습니다. 하지만 최근의 발전에도 불구하고, 현재 LLM 기반 추천 시스템은 여전히 이질적인 증거에서 의사 결정에 관련된 맥락을 구성하는 데 어려움을 겪고 있습니다. 첫째, 기존 방법은 종종 고정된 맥락 구성 전략에 의존합니다. 협업 행동 데이터와 아이템 메타데이터는 일반적으로 미리 정의된 프롬프트, 정적인 검색 파이프라인 또는 수작업으로 제작된 메커니즘을 통해 통합되므로, 각 인스턴스에 실제로 유용한 정보가 무엇인지 파악하기 어렵습니다. 둘째, 이질적인 증거는 심각한 맥락 효율성 병목 현상을 야기합니다. 풍부한 메타데이터와 협업 상호 작용 기록은 컨텍스트 창을 빠르게 채울 수 있으며, 공격적인 압축 또는 휴리스틱 필터링은 정확한 추천에 중요한 세부 정보를 삭제할 수 있습니다. 이러한 문제를 해결하기 위해, 우리는 LLM 기반 에이전트 추천 시스템을 위한 협업 및 메타데이터 메모리를 활용한 순위 기반 정보 검색 및 추론 프레임워크인 RRCM을 제안합니다. RRCM은 간단한 사용자 이력 맥락에서 시작하여 직접 추천할지, 협업 증거를 검색할지, 아이템 메타데이터를 검색할지, 또는 둘을 결합하여 추론할지를 학습합니다. 두 메모리 모두 자연어로 표현되며, 수작업으로 제작된 협업 필터링 주입 또는 고정된 검색 규칙 없이도 유연한 증거 획득을 가능하게 하는 통합된 검색 인터페이스를 통해 접근합니다. 우리는 그룹 상대 정책 최적화를 사용하여 구현된 결과 기반 순위 보상을 통해 이 메모리 읽기 정책을 최적화하여, 검색 결정이 최종 상위 k개 추천 품질에 직접적으로 영향을 받도록 합니다. 광범위한 실험 결과, RRCM은 기존의 기본 모델 및 다양한 LLM 기반 추천 방식보다 훨씬 우수한 성능을 보이는 것으로 나타났습니다.

Original Abstract

Large Language Models (LLMs) have emerged as a promising paradigm for next-generation recommender systems, offering strong semantic understanding and natural-language reasoning abilities. Despite recent progress, current LLM-based recommenders still face key challenges in constructing decision-relevant contexts from heterogeneous evidence. First, existing methods often rely on fixed context construction strategies: collaborative behavioral evidence and item-side metadata are typically incorporated through predefined prompts, static retrieval pipelines, or handcrafted injection mechanisms, making it difficult to determine what information is truly beneficial for each instance. Second, heterogeneous evidence introduces a severe context-efficiency bottleneck. Rich metadata and collaborative interaction records can quickly overwhelm the context window, while aggressive compression or heuristic filtering may discard fine-grained evidence critical for accurate recommendation. To address these challenges, we propose RRCM, a ranking-driven retrieval-and-reasoning framework over collaborative and metadata memories for LLM-based agentic recommendation. RRCM starts from a lightweight user-history context and learns whether to recommend directly, retrieve collaborative evidence, retrieve item metadata, or interleave both through reasoning. Both memories are represented in natural language and accessed through a unified retrieval interface, enabling flexible evidence acquisition without handcrafted CF injection or fixed retrieval rules. We optimize this memory-reading policy with an outcome-only ranking reward, instantiated using group relative policy optimization, so that retrieval decisions are directly driven by final top-k recommendation quality. Extensive experiments show that RRCM significantly outperforms traditional baselines and diverse LLM-based recommendation approaches.

0 Citations
0 Influential
2 Altmetric
10.0 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!