시맨틱 ID 기반 추론이 생성적 추천 성능을 향상시킨다
Reasoning over Semantic IDs Enhances Generative Recommendation
최근 생성적 추천 분야의 발전은 사전 훈련된 LLM(Large Language Models)을 활용하여 순차적 추천을 언어 토큰과 항목 식별자를 포괄하는 통합 토큰 공간에서의 자기 회귀 생성 문제로 정의하는 방식으로 이루어지고 있습니다. 여기서 각 항목은 '시맨틱 ID(SID)'라고 하는 짧은 이산 토큰 시퀀스로 표현됩니다. 이러한 SID 기반 접근 방식은 대규모 항목 데이터셋에 대한 효율적인 디코딩을 가능하게 하며, LLM 기반 추천 시스템이 풍부한 세계 지식을 활용할 수 있는 자연스러운 인터페이스를 제공합니다. 한편, LLM 추론 분야의 발전은 추론 능력 향상을 통한 추천 시스템 개선을 가능하게 하지만, SID에 대한 효과적인 추론은 아직 충분히 연구되지 않았으며, 어려운 과제입니다. 항목 토큰은 LLM에게 본질적으로 의미 있는 정보가 아니며, 추천 시스템에 특화된 SID 추론은 평가하기 어렵기 때문에 고품질의 지도 데이터 확보가 어렵습니다. 이러한 문제점을 해결하기 위해, 우리는 SIDReasoner라는 두 단계 프레임워크를 제안합니다. SIDReasoner는 추천 시스템에 특화된 추론 데이터에 의존하는 대신, SID와 언어 간의 연관성을 강화하여 전이 가능한 LLM 추론 능력을 활용하여 SID 기반 추론을 촉진합니다. 구체적으로, SIDReasoner는 먼저 더 강력한 교사 모델을 사용하여 생성된 풍부한 SID 중심 코퍼스에 대한 멀티태스크 훈련을 통해 SID와 언어 간의 연관성을 강화하여 항목 토큰을 다양한 의미적, 행동적 맥락에 연결합니다. 이러한 강화된 연관성을 바탕으로, SIDReasoner는 모델이 명시적인 추론 주석 없이 효과적인 추론 경로를 따르도록 안내하는 결과 중심의 강화 최적화를 통해 추천 추론 능력을 더욱 향상시킵니다. 세 개의 실제 데이터셋에 대한 광범위한 실험 결과는 SID 기반 생성적 추천 시스템에 추론 능력을 추가함으로써 얻을 수 있는 효과를 입증합니다. 또한, 이러한 결과는 생성적 추천 시스템에서 대규모 추론 모델의 더 넓은 잠재력을 보여주며, 여기에는 향상된 해석 가능성과 다양한 도메인으로의 일반화가 포함됩니다.
Recent advances in generative recommendation have leveraged pretrained LLMs by formulating sequential recommendation as autoregressive generation over a unified token space comprising language tokens and itemic identifiers, where each item is represented by a compact sequence of discrete tokens, namely Semantic IDs (SIDs). This SID-based formulation enables efficient decoding over large-scale item corpora and provides a natural interface for LLM-based recommenders to leverage rich world knowledge. Meanwhile, breakthroughs in LLM reasoning motivate reasoning-enhanced recommendation, yet effective reasoning over SIDs remains underexplored and challenging. Itemic tokens are not natively meaningful to LLMs; moreover, recommendation-oriented SID reasoning is hard to evaluate, making high-quality supervision scarce. To address these challenges, we propose SIDReasoner, a two-stage framework that elicits reasoning over SIDs by strengthening SID--language alignment to unlock transferable LLM reasoning, rather than relying on large amounts of recommendation-specific reasoning traces. Concretely, SIDReasoner first enhances SID-language alignment via multi-task training on an enriched SID-centered corpus synthesized by a stronger teacher model, grounding itemic tokens in diverse semantic and behavioral contexts. Building on this enhanced alignment, SIDReasoner further improves recommendation reasoning through outcome-driven reinforced optimization, which guides the model toward effective reasoning trajectories without requiring explicit reasoning annotations. Extensive experiments on three real-world datasets demonstrate the effectiveness of our reasoning-augmented SID-based generative recommendation. Beyond accuracy, the results highlight the broader potential of large reasoning models for generative recommendation, including improved interpretability and cross-domain generalization.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.