2604.08123v1 Apr 09, 2026 cs.DC

LegoDiffusion: 텍스트-이미지 확산 워크플로우의 마이크로 서비스 아키텍처

LegoDiffusion: Micro-Serving Text-to-Image Diffusion Workflows

Weiyi Lu
Weiyi Lu
Citations: 29
h-index: 3
Kan Liu
Kan Liu
Citations: 51
h-index: 4
Tao Lan
Tao Lan
Citations: 38
h-index: 3
Lingyun Yang
Lingyun Yang
Citations: 36
h-index: 3
Tianyu Feng
Tianyu Feng
Citations: 7
h-index: 2
Zhipeng Di
Zhipeng Di
Citations: 26
h-index: 3
Guodong Yang
Guodong Yang
Citations: 405
h-index: 9
Lin Qu
Lin Qu
Citations: 164
h-index: 7
Suyi Li
Suyi Li
Citations: 1,544
h-index: 8
Xiaoxiao Jiang
Xiaoxiao Jiang
Citations: 24
h-index: 2
Yinghao Yu
Yinghao Yu
Citations: 20
h-index: 2
Liping Zhang
Liping Zhang
Citations: 83
h-index: 5
Wei Wang
Wei Wang
Citations: 74
h-index: 5

텍스트-이미지 생성은 핵심 확산 모델을 중심으로 여러 모델을 포함하는 확산 워크플로우를 실행합니다. 기존의 서비스 시스템은 이러한 워크플로우를 불투명한 통합 시스템으로 취급하며, 모든 구성 모델을 함께 프로비저닝, 배치 및 확장하여 내부 데이터 흐름을 가리고, 모델 공유를 방해하며, 세분화되지 않은 리소스 관리를 강제합니다. 본 논문에서는 LegoDiffusion이라는 시스템을 통해 확산 워크플로우를 마이크로 서비스 아키텍처로 분리하는 것이 효과적임을 주장합니다. LegoDiffusion은 워크플로우를 독립적으로 관리 및 예약할 수 있는 느슨하게 결합된 모델 실행 노드로 분해합니다. LegoDiffusion은 개별 모델 추론을 명시적으로 관리함으로써, 모델별 확장, 모델 공유 및 적응형 모델 병렬 처리과 같은 클러스터 규모의 최적화를 가능하게 합니다. 종합적으로, LegoDiffusion은 기존의 확산 워크플로우 서비스 시스템보다 뛰어난 성능을 보이며, 최대 3배 더 높은 요청 처리량과 최대 8배 더 높은 트래픽 버스트를 처리할 수 있습니다.

Original Abstract

Text-to-image generation executes a diffusion workflow comprising multiple models centered on a base diffusion model. Existing serving systems treat each workflow as an opaque monolith, provisioning, placing, and scaling all constituent models together, which obscures internal dataflow, prevents model sharing, and enforces coarse-grained resource management. In this paper, we make a case for micro-serving diffusion workflows with LegoDiffusion, a system that decomposes a workflow into loosely coupled model-execution nodes that can be independently managed and scheduled. By explicitly managing individual model inference, LegoDiffusion unlocks cluster-scale optimizations, including per-model scaling, model sharing, and adaptive model parallelism. Collectively, LegoDiffusion outperforms existing diffusion workflow serving systems, sustaining up to 3x higher request rates and tolerating up to 8x higher burst traffic.

0 Citations
0 Influential
4.5 Altmetric
22.5 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!