이분 시점에서 협업 필터링은 왜 사용할 수 없는가? 희소 모델과 밀집 모델 간의 간극을 해소하다
Why not Collaborative Filtering in Dual View? Bridging Sparse and Dense Models
협업 필터링(CF)은 현대적인 추천 시스템의 핵심 기술이며, 밀집 임베딩 기반 방법이 현재 널리 사용되고 있습니다. 그러나 이러한 접근 방식은 중요한 한계를 가지고 있으며, 본 연구에서는 이론적 분석을 통해 인기가 낮은 항목을 모델링할 때 발생하는 기본적인 신호 대 잡음비(SNR)의 상한선 문제를 밝혀냈습니다. 특히, 파라미터 기반의 밀집 모델은 심각한 데이터 희소성 환경에서 SNR이 현저히 감소하는 경향이 있습니다. 이러한 병목 현상을 해결하기 위해, 본 연구에서는 의미론적 표현력을 가진 밀집 임베딩과 구조적 안정성을 가진 희소 상호작용 패턴을 통합하는 통합 프레임워크인 SaD(Sparse and Dense)를 제안합니다. 이론적으로 SaD는 이러한 이분 관점을 정렬함으로써 전반적으로 훨씬 우수한 SNR을 달성함을 보여줍니다. 구체적으로, SaD는 경량의 양방향 정렬 메커니즘을 도입합니다. 밀집 관점은 의미론적 상관관계를 주입하여 희소 관점을 풍부하게 하고, 희소 관점은 명시적인 구조적 신호를 통해 밀집 모델을 정규화합니다. 광범위한 실험 결과, 이러한 이분 관점 정렬을 통해 간단한 행렬 분해 스타일의 밀집 모델조차도 최첨단 성능을 달성할 수 있음을 보여줍니다. 또한, SaD는 적용이 용이하며 기존의 다양한 추천 모델에 원활하게 적용될 수 있습니다. 이는 협업 필터링이 이분 관점에서 활용될 때 여전히 강력한 잠재력을 가지고 있음을 보여줍니다. 실제 벤치마크 데이터에 대한 추가적인 평가 결과, SaD는 강력한 기준 모델들을 지속적으로 능가하며, BarsMatch 리더보드에서 1위를 차지했습니다. SaD의 코드는 https://github.com/harris26-G/SaD 에서 공개적으로 이용할 수 있습니다.
Collaborative Filtering (CF) remains the cornerstone of modern recommender systems, with dense embedding--based methods dominating current practice. However, these approaches suffer from a critical limitation: our theoretical analysis reveals a fundamental signal-to-noise ratio (SNR) ceiling when modeling unpopular items, where parameter-based dense models experience diminishing SNR under severe data sparsity. To overcome this bottleneck, we propose SaD (Sparse and Dense), a unified framework that integrates the semantic expressiveness of dense embeddings with the structural reliability of sparse interaction patterns. We theoretically show that aligning these dual views yields a strictly superior global SNR. Concretely, SaD introduces a lightweight bidirectional alignment mechanism: the dense view enriches the sparse view by injecting semantic correlations, while the sparse view regularizes the dense model through explicit structural signals. Extensive experiments demonstrate that, under this dual-view alignment, even a simple matrix factorization--style dense model can achieve state-of-the-art performance. Moreover, SaD is plug-and-play and can be seamlessly applied to a wide range of existing recommender models, highlighting the enduring power of collaborative filtering when leveraged from dual perspectives. Further evaluations on real-world benchmarks show that SaD consistently outperforms strong baselines, ranking first on the BarsMatch leaderboard. The code is publicly available at https://github.com/harris26-G/SaD.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.