지식 격차 해소: LLM 추천 시스템을 위한 선택적 지식 증강
Filling the Gaps: Selective Knowledge Augmentation for LLM Recommenders
최근 대규모 언어 모델(LLM)은 별도의 학습 없이 강력한 추천 시스템으로 활용될 수 있게 되었습니다. 그러나 사전 학습 과정에서 정보 노출의 불균형으로 인해 개별 항목에 대한 LLM의 지식 수준은 필연적으로 불균등한데, 우리는 이를 '지식 격차 문제'라고 부릅니다. 이러한 문제를 해결하기 위해 기존 연구에서는 대부분 입력 프롬프트의 모든 항목에 대해 외부 정보를 무작정 추가하는 단순한 증강 방식을 사용했습니다. 그러나 이러한 접근 방식은 잘 알려진 항목에 대한 불필요한 증강으로 제한된 컨텍스트 예산을 낭비할 뿐만 아니라 모델의 효과적인 추론 능력을 저해할 수 있습니다. 이에 우리는 지식 격차 문제를 완화하기 위해 KnowSA_CKP (Knowledge-aware Selective Augmentation with Comparative Knowledge Probing)라는 방법을 제안합니다. KnowSA_CKP는 LLM의 내부 지식을 평가하여 협업 관계를 파악하는 능력을 측정하고, 필요한 항목에만 선택적으로 추가 정보를 주입합니다. KnowSA_CKP는 잘 알려진 항목에 대한 불필요한 증강을 피함으로써 지식 보완의 이점을 가장 많이 얻을 수 있는 항목에 집중하여 컨텍스트 예산을 더욱 효율적으로 활용합니다. KnowSA_CKP는 별도의 미세 조정 과정이 필요 없으며, 네 가지 실제 데이터 세트에서 추천 정확도와 컨텍스트 효율성을 모두 향상시키는 결과를 보였습니다.
Large language models (LLMs) have recently emerged as powerful training-free recommenders. However, their knowledge of individual items is inevitably uneven due to imbalanced information exposure during pretraining, a phenomenon we refer to as knowledge gap problem. To address this, most prior methods have employed a naive uniform augmentation that appends external information for every item in the input prompt. However, this approach not only wastes limited context budget on redundant augmentation for well-known items but can also hinder the model's effective reasoning. To this end, we propose KnowSA_CKP (Knowledge-aware Selective Augmentation with Comparative Knowledge Probing) to mitigate the knowledge gap problem. KnowSA_CKP estimates the LLM's internal knowledge by evaluating its capability to capture collaborative relationships and selectively injects additional information only where it is most needed. By avoiding unnecessary augmentation for well-known items, KnowSA_CKP focuses on items that benefit most from knowledge supplementation, thereby making more effective use of the context budget. KnowSA_CKP requires no fine-tuning step, and consistently improves both recommendation accuracy and context efficiency across four real-world datasets.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.