2602.02033v1 Feb 02, 2026 cs.CV

하나의 모델, 다양한 적용: 대규모 광고 이미지 생성에서의 다양한 그룹별 클릭 선호도 일치

One Size, Many Fits: Aligning Diverse Group-Wise Click Preferences in Large-Scale Advertising Image Generation

Ao Ma
Ao Ma
Citations: 40
h-index: 3
Jian Liang
Jian Liang
Citations: 4
h-index: 1
Shuo Lu
Shuo Lu
Citations: 38
h-index: 2
Yongcan Yu
Yongcan Yu
Citations: 40
h-index: 3
Haohan Wang
Haohan Wang
Citations: 46
h-index: 3
Wei Feng
Wei Feng
Citations: 73
h-index: 5
Weizhen Wang
Weizhen Wang
Citations: 16
h-index: 1
Shengying Zhang
Shengying Zhang
Citations: 8
h-index: 1
Yaoyu Li
Yaoyu Li
Citations: 68
h-index: 5
Zheng Zhang
Zheng Zhang
Citations: 85
h-index: 6
Jingjing Lv
Jingjing Lv
Citations: 146
h-index: 8
Jun-Jun Shen
Jun-Jun Shen
Citations: 139
h-index: 7
Ching Law
Ching Law
Citations: 8
h-index: 2
Bing Zhan
Bing Zhan
Citations: 58
h-index: 3
Yuan Xu
Yuan Xu
Citations: 7
h-index: 1
Huizai Yao
Huizai Yao
Citations: 20
h-index: 2
Chenyang Si
Chenyang Si
Citations: 16
h-index: 1

광고 이미지 생성은 클릭률(CTR)과 같은 온라인 지표에 점점 더 집중하고 있지만, 기존 접근 방식은 전체 CTR을 최적화하는 "하나의 크기에 모두 맞춤" 전략을 채택하여 사용자 그룹 간의 선호도 다양성을 간과합니다. 이는 특정 그룹에 대한 성능 저하를 초래하며, 타겟 마케팅의 효과를 제한합니다. 이러한 격차를 해소하기 위해, 우리는 대규모 광고 이미지 생성에서 다양한 그룹별 클릭 선호도를 일치시키는 통합 프레임워크인 "하나의 모델, 다양한 적용(One Size, Many Fits, OSMF)"을 제시합니다. OSMF는 제품 인지적 적응적 그룹화를 통해 사용자의 속성과 제품 특징을 기반으로 사용자를 동적으로 구성하고, 각 그룹을 풍부한 집단 선호도 특징으로 표현합니다. 이러한 그룹을 기반으로, 선호도 기반 이미지 생성은 그룹 인지형 다중 모드 대규모 언어 모델(G-MLLM)을 사용하여 각 그룹에 맞는 맞춤형 이미지를 생성합니다. G-MLLM은 그룹 특징을 동시에 이해하고 광고 이미지를 생성하도록 사전 훈련됩니다. 이후, 우리는 제안하는 그룹-DPO(Group-DPO)를 사용하여 G-MLLM을 미세 조정하여 그룹별 선호도 일치도를 효과적으로 향상시키고, 생성된 이미지에 대한 각 그룹의 CTR을 향상시킵니다. 또한, 본 연구에서는 그룹별 이미지 선호도 데이터셋인 그룹 광고 이미지 선호도 데이터셋(GAIP)을 공개합니다. 이는 4천만 명의 사용자로 구성된 약 60만 개의 그룹을 포함하는 최초의 대규모 공개 데이터셋입니다. 광범위한 실험을 통해, 우리의 프레임워크가 오프라인 및 온라인 환경 모두에서 최첨단 성능을 달성함을 입증했습니다. 우리의 코드 및 데이터셋은 https://github.com/JD-GenX/OSMF 에서 제공됩니다.

Original Abstract

Advertising image generation has increasingly focused on online metrics like Click-Through Rate (CTR), yet existing approaches adopt a ``one-size-fits-all" strategy that optimizes for overall CTR while neglecting preference diversity among user groups. This leads to suboptimal performance for specific groups, limiting targeted marketing effectiveness. To bridge this gap, we present \textit{One Size, Many Fits} (OSMF), a unified framework that aligns diverse group-wise click preferences in large-scale advertising image generation. OSMF begins with product-aware adaptive grouping, which dynamically organizes users based on their attributes and product characteristics, representing each group with rich collective preference features. Building on these groups, preference-conditioned image generation employs a Group-aware Multimodal Large Language Model (G-MLLM) to generate tailored images for each group. The G-MLLM is pre-trained to simultaneously comprehend group features and generate advertising images. Subsequently, we fine-tune the G-MLLM using our proposed Group-DPO for group-wise preference alignment, which effectively enhances each group's CTR on the generated images. To further advance this field, we introduce the Grouped Advertising Image Preference Dataset (GAIP), the first large-scale public dataset of group-wise image preferences, including around 600K groups built from 40M users. Extensive experiments demonstrate that our framework achieves the state-of-the-art performance in both offline and online settings. Our code and datasets will be released at https://github.com/JD-GenX/OSMF.

1 Citations
0 Influential
32.047189562171 Altmetric
161.2 Score
Original PDF
4

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!