2603.14773v1 Mar 16, 2026 cs.LG

HO-SFL: 백프로파게이션이 없는 클라이언트와 차원 제약 없는 집계를 갖는 하이브리드 순위 분할 연합 학습

HO-SFL: Hybrid-Order Split Federated Learning with Backprop-Free Clients and Dimension-Free Aggregation

Qiyuan Chen
Qiyuan Chen
Citations: 483
h-index: 3
Xian Wu
Xian Wu
Citations: 49
h-index: 4
Yi Wang
Yi Wang
Citations: 3
h-index: 1
Xianhao Chen
Xianhao Chen
Citations: 2,876
h-index: 30

대규모 모델을 엣지 장치에서 미세 조정하는 것은 표준 연합 학습 및 분할 학습 프레임워크에서 발생하는 메모리 집약적인 역전파(BP) 때문에 심각하게 제한됩니다. 역전파를 0차 최적화로 대체하면 메모리 사용량을 크게 줄일 수 있지만, 일반적으로 수용할 수 없을 정도로 낮은 수렴 속도를 보입니다. 이러한 딜레마를 해결하기 위해, 본 논문에서는 하이브리드 순위 분할 연합 학습(HO-SFL)을 제안합니다. HO-SFL은 분할 학습 프로세스를 라그랑주 프레임워크 내에서 재구성하여 최적화 환경을 분리합니다. 서버는 정확한 1차 업데이트(즉, 역전파)를 수행하는 반면, 클라이언트는 메모리 효율적인 0차 최적화를 수행합니다. 이러한 하이브리드 설계는 클라이언트 측 역전파의 필요성을 없애는 동시에 차원 제약 없는 모델 집계를 가능하게 하여 통신 비용을 크게 줄입니다. 또한, 우리는 HO-SFL의 이론적 수렴 분석을 제공하여, HO-SFL이 0차 최적화의 차원에 의존적인 수렴 속도 저하를 완화하여 1차 방법과 유사한 수렴 속도를 달성한다는 것을 보여줍니다. 시각 및 언어 모드에서 다양한 작업에 대한 광범위한 실험 결과는 HO-SFL이 1차 기준 모델과 유사한 수렴 속도를 달성하면서도 통신 비용과 클라이언트 메모리 사용량을 크게 줄인다는 것을 입증합니다.

Original Abstract

Fine-tuning large models on edge devices is severely hindered by the memory-intensive backpropagation (BP) in standard frameworks like federated learning and split learning. While substituting BP with zeroth-order optimization can significantly reduce memory footprints, it typically suffers from prohibitively degraded convergence speed. To resolve this dilemma, we propose Hybrid-Order Split Federated Learning (HO-SFL). By reformulating the split learning process within a Lagrangian framework, HO-SFL decouples the optimization landscape: The server performs precise first-order updates (i.e., BP), whereas clients conduct memory-efficient zeroth-order optimization. This hybrid design not only eliminates the need for client-side BP but also enables dimension-free model aggregation, drastically lowering communication costs. Crucially, we provide a theoretical convergence analysis, demonstrating that HO-SFL mitigates the dimension-dependent convergence slowdown of zeroth-order optimization, achieving a convergence rate comparable to first-order methods. Extensive experiments on tasks across vision and language modalities validate that HO-SFL achieves convergence speeds comparable to first-order baselines while significantly reducing communication costs and client memory footprints.

0 Citations
0 Influential
15 Altmetric
75.0 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!