2603.03714v1 Mar 04, 2026 cs.CL

질서는 레이아웃이 아니다: 이미지 생성 모델에서의 순서-공간 편향

Order Is Not Layout: Order-to-Space Bias in Image Generation

Wenxuan Wang
Wenxuan Wang
Citations: 52
h-index: 4
Zonglin Zhao
Zonglin Zhao
Citations: 0
h-index: 0
Yongkang Zhang
Yongkang Zhang
Citations: 36
h-index: 2
Fei Ding
Fei Ding
Citations: 246
h-index: 7
Peize Li
Peize Li
Citations: 14
h-index: 1
Yuechen Zhang
Yuechen Zhang
The Chinese University of Hong Kong
Citations: 1,784
h-index: 16

본 연구에서는 현대 이미지 생성 모델에서 나타나는 체계적인 편향을 분석합니다. 텍스트에서 객체의 언급 순서가 공간적 배치와 객체-역할 연결에 부적절하게 영향을 미치는 현상을 '순서-공간 편향(Order-to-Space Bias, OTS)'이라고 명명하고, 이는 텍스트-이미지 및 이미지-이미지 생성 모두에서 나타나며, 종종 실제 정보와 상반되는 잘못된 배치 또는 역할 변경을 초래한다는 것을 확인했습니다. OTS를 정량화하기 위해, 본 연구에서는 객체 순서만 다른 쌍의 프롬프트를 사용하여 순서 효과를 분리하는 'OTS-Bench'를 제안하고, 모델을 균일성(homogenization)과 정확성(correctness)이라는 두 가지 측면에서 평가합니다. 실험 결과, 순서-공간 편향(OTS)이 현대 이미지 생성 모델에서 널리 나타나는 현상이며, 주로 데이터 기반으로 발생하며 레이아웃 형성이 초기 단계에서 나타난다는 것을 확인했습니다. 이러한 통찰력을 바탕으로, 본 연구에서는 특정 fine-tuning과 초기 단계 개입 전략이 OTS를 크게 줄이는 동시에 생성 품질을 유지할 수 있음을 보여줍니다.

Original Abstract

We study a systematic bias in modern image generation models: the mention order of entities in text spuriously determines spatial layout and entity--role binding. We term this phenomenon Order-to-Space Bias (OTS) and show that it arises in both text-to-image and image-to-image generation, often overriding grounded cues and causing incorrect layouts or swapped assignments. To quantify OTS, we introduce OTS-Bench, which isolates order effects with paired prompts differing only in entity order and evaluates models along two dimensions: homogenization and correctness. Experiments show that Order-to-Space Bias (OTS) is widespread in modern image generation models, and provide evidence that it is primarily data-driven and manifests during the early stages of layout formation. Motivated by this insight, we show that both targeted fine-tuning and early-stage intervention strategies can substantially reduce OTS, while preserving generation quality.

0 Citations
0 Influential
8 Altmetric
40.0 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!