MeanCache: 순간 속도에서 평균 속도로 전환하여 가속 흐름 매칭 추론 효율성을 향상시키는 방법
MeanCache: From Instantaneous to Average Velocity for Accelerating Flow Matching Inference
본 논문에서는 Flow Matching 추론의 효율성을 높이는 훈련이 필요 없는 캐싱 프레임워크인 MeanCache를 제안합니다. 기존의 캐싱 방법들은 중복 연산을 줄이는 데 효과적이지만, 일반적으로 순간 속도 정보(예: 특징 캐싱)에 의존하는데, 이는 높은 가속 비율에서 심각한 경로 편차와 오차 누적을 초래하는 경우가 많습니다. MeanCache는 평균 속도 관점을 도입하여, 캐시된 Jacobian-vector 곱셈(JVP)을 활용하여 순간 속도로부터 구간 평균 속도를 구성함으로써, 국부적인 오차 누적을 효과적으로 완화합니다. 또한, 캐시 타이밍 및 JVP 재사용 안정성을 더욱 향상시키기 위해, 경로 안정성을 고려한 스케줄링 전략을 개발하여, 예산 제약 하에서 Peak-Suppressed Shortest Path 알고리즘을 사용하여 스케줄을 결정합니다. FLUX.1, Qwen-Image, 그리고 HunyuanVideo 데이터셋에 대한 실험 결과, MeanCache는 각각 4.12배, 4.56배, 3.59배의 속도 향상을 달성했으며, 생성 품질 측면에서도 최첨단 캐싱 방법들을 지속적으로 능가하는 성능을 보였습니다. 본 논문에서 제시하는 간단하면서도 효과적인 접근 방식은 Flow Matching 추론에 대한 새로운 관점을 제시하며, 상용 규모의 생성 모델에서 안정성을 기반으로 한 가속 기술 개발에 영감을 줄 것으로 기대합니다.
We present MeanCache, a training-free caching framework for efficient Flow Matching inference. Existing caching methods reduce redundant computation but typically rely on instantaneous velocity information (e.g., feature caching), which often leads to severe trajectory deviations and error accumulation under high acceleration ratios. MeanCache introduces an average-velocity perspective: by leveraging cached Jacobian--vector products (JVP) to construct interval average velocities from instantaneous velocities, it effectively mitigates local error accumulation. To further improve cache timing and JVP reuse stability, we develop a trajectory-stability scheduling strategy as a practical tool, employing a Peak-Suppressed Shortest Path under budget constraints to determine the schedule. Experiments on FLUX.1, Qwen-Image, and HunyuanVideo demonstrate that MeanCache achieves 4.12X and 4.56X and 3.59X acceleration, respectively, while consistently outperforming state-of-the-art caching baselines in generation quality. We believe this simple yet effective approach provides a new perspective for Flow Matching inference and will inspire further exploration of stability-driven acceleration in commercial-scale generative models.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.