LLM 후처리 기반 넷플릭스 콘텐츠 아트 개인화
Netflix Artwork Personalization via LLM Post-training
대규모 언어 모델(LLM)은 전자상거래 및 엔터테인먼트 분야의 다양한 사용자 추천 및 개인화 응용 분야에서 성공적인 결과를 보여주었습니다. 넷플릭스와 같은 많은 엔터테인먼트 플랫폼에서 사용자는 다양한 콘텐츠를 접하게 되며, 각 콘텐츠는 고유한 아트를 통해 표현됩니다. 사용자의 다양한 선호도를 고려할 때, 특정 유형의 사용자에게 어필하는 아트는 다른 선호도를 가진 사용자에게는 매력적이지 않을 수 있습니다. 이러한 사용자 다양성을 고려하여, 본 연구에서는 다양한 사용자 선호도에 따른 개인화된 콘텐츠 아트 추천이라는 새로운 문제를 탐구합니다. 사용자의 취향이 다차원적인 것처럼, 콘텐츠 역시 다양한 주제와 분위기를 가지고 있으며, 이는 서로 다른 시청자에게 어필할 수 있습니다. 예를 들어, 동일한 콘텐츠는 감동적인 가족 드라마와 강렬한 액션 장면을 모두 포함할 수 있습니다. 로맨틱한 콘텐츠를 선호하는 사용자는 등장인물 간의 감정적인 교류를 강조하는 아트에 더 끌릴 수 있는 반면, 액션 스릴러를 선호하는 사용자는 고강도 액션 장면이 더 흥미로울 수 있습니다. 본 연구에서는 사전 학습된 LLM을 후처리하여 개인화된 콘텐츠 아트 추천을 제공합니다. 즉, 각 사용자가 가장 선호하는 콘텐츠의 시각적 표현을 선택하여 사용자 만족도와 참여도를 향상시킵니다. Llama 3.1 8B 모델을 사용하여 실험한 결과(11만 개의 데이터 포인트로 학습하고 5천 개의 사용자-콘텐츠 쌍으로 평가), 후처리된 LLM이 넷플릭스 실제 모델보다 3~5% 향상된 성능을 보였습니다. 이는 LLM을 활용한 세분화된 개인화 추천에 대한 유망한 방향을 제시합니다.
Large language models (LLMs) have demonstrated success in various applications of user recommendation and personalization across e-commerce and entertainment. On many entertainment platforms such as Netflix, users typically interact with a wide range of titles, each represented by an artwork. Since users have diverse preferences, an artwork that appeals to one type of user may not resonate with another with different preferences. Given this user heterogeneity, our work explores the novel problem of personalized artwork recommendations according to diverse user preferences. Similar to the multi-dimensional nature of users' tastes, titles contain different themes and tones that may appeal to different viewers. For example, the same title might feature both heartfelt family drama and intense action scenes. Users who prefer romantic content may like the artwork emphasizing emotional warmth between the characters, while those who prefer action thrillers may find high-intensity action scenes more intriguing. Rather than a one-size-fits-all approach, we conduct post-training of pre-trained LLMs to make personalized artwork recommendations, selecting the most preferred visual representation of a title for each user and thereby improving user satisfaction and engagement. Our experimental results with Llama 3.1 8B models (trained on a dataset of 110K data points and evaluated on 5K held-out user-title pairs) show that the post-trained LLMs achieve 3-5\% improvements over the Netflix production model, suggesting a promising direction for granular personalized recommendations using LLMs.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.