2601.20422v1 Jan 28, 2026 cs.GT

추천 시스템 개선을 위한 정보 기반 자동 입찰 전략: 콘텐츠 홍보

Guiding the Recommender: Information-Aware Auto-Bidding for Content Promotion

Yumou Liu
Yumou Liu
Citations: 8
h-index: 1
Zhenzhe Zheng
Zhenzhe Zheng
Citations: 1,843
h-index: 25
Yao Hu
Yao Hu
Citations: 52
h-index: 3
Jiang Rong
Jiang Rong
Citations: 68
h-index: 5
Fan Wu
Fan Wu
Citations: 34
h-index: 3
Guihai Chen
Guihai Chen
Citations: 67
h-index: 5

현대 콘텐츠 플랫폼은 콜드 스타트 문제를 해결하기 위해 경매를 통해 노출을 할당하는 유료 홍보 서비스를 제공합니다. 본 연구에서는 이러한 방식에 내재된 역설적인 문제점을 밝혀냈습니다. 즉, 홍보가 저품질 또는 중품질 콘텐츠에는 도움이 될 수 있지만, 고품질 콘텐츠를 최적의 사용자에게 노출시키지 못하여 참여도 지표를 왜곡하고 향후 추천 시스템의 성능을 저하시킬 수 있다는 것입니다. 본 연구는 콘텐츠 홍보를 단기적인 가치 확보와 장기적인 모델 개선이라는 이중 목표를 균형 있게 달성하는 최적화 문제로 재정의합니다. 이를 위해, 입찰 시점에 적용 가능한 분해 가능한 대체 목표 함수인 '그래디언트 커버리지(gradient coverage)'를 제안하고, 이 개념이 피셔 정보(Fisher Information) 및 최적 실험 설계와 어떻게 관련되는지 이론적으로 분석합니다. 또한, 랑그랑주 쌍립성(Lagrange duality)에 기반한 두 단계의 자동 입찰 알고리즘을 설계하여, 그림자 가격(shadow price)을 통해 예산을 동적으로 조정하고, 각 노출에 대한 한계 효용을 기반으로 입찰가를 최적화합니다. 입찰 시점에 레이블이 누락되는 문제를 해결하기 위해, 신뢰도 기반의 그래디언트 휴리스틱(confidence-gated gradient heuristic)을 제안하며, 블랙박스 모델에 대한 제로차(zeroth-order) 변형을 함께 사용하여 실시간으로 학습 신호를 안정적으로 추정합니다. 본 연구에서는 제안하는 방법론에 대한 이론적 보장을 제공하며, 합성 데이터 및 실제 데이터셋에 대한 광범위한 오프라인 실험을 통해, 제안하는 방법이 기존 방법보다 우수한 성능을 보이며, 최종 AUC/LogLoss 점수가 향상되고, 예산 목표에 가깝게 준수되며, 그래디언트가 제로차로 근사될 때에도 효과적임을 입증했습니다. 이러한 결과는 정보 기반의 전략적인 홍보가 단순한 노출 극대화 전략보다 장기적인 모델 성능 및 자연적인 성과를 향상시킬 수 있음을 보여줍니다.

Original Abstract

Modern content platforms offer paid promotion to mitigate cold start by allocating exposure via auctions. Our empirical analysis reveals a counterintuitive flaw in this paradigm: while promotion rescues low-to-medium quality content, it can harm high-quality content by forcing exposure to suboptimal audiences, polluting engagement signals and downgrading future recommendation. We recast content promotion as a dual-objective optimization that balances short-term value acquisition with long-term model improvement. To make this tractable at bid time in content promotion, we introduce a decomposable surrogate objective, gradient coverage, and establish its formal connection to Fisher Information and optimal experimental design. We design a two-stage auto-bidding algorithm based on Lagrange duality that dynamically paces budget through a shadow price and optimizes impression-level bids using per-impression marginal utilities. To address missing labels at bid time, we propose a confidence-gated gradient heuristic, paired with a zeroth-order variant for black-box models that reliably estimates learning signals in real time. We provide theoretical guarantees, proving monotone submodularity of the composite objective, sublinear regret in online auction, and budget feasibility. Extensive offline experiments on synthetic and real-world datasets validate the framework: it outperforms baselines, achieves superior final AUC/LogLoss, adheres closely to budget targets, and remains effective when gradients are approximated zeroth-order. These results show that strategic, information-aware promotion can improve long-term model performance and organic outcomes beyond naive impression-maximization strategies.

0 Citations
0 Influential
12.5 Altmetric
62.5 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!