HO-SFL: 백프로파게이션이 없는 클라이언트와 차원 제약 없는 집계를 갖는 하이브리드 순위 분할 연합 학습
HO-SFL: Hybrid-Order Split Federated Learning with Backprop-Free Clients and Dimension-Free Aggregation
대규모 모델을 엣지 장치에서 미세 조정하는 것은 표준 연합 학습 및 분할 학습 프레임워크에서 발생하는 메모리 집약적인 역전파(BP) 때문에 심각하게 제한됩니다. 역전파를 0차 최적화로 대체하면 메모리 사용량을 크게 줄일 수 있지만, 일반적으로 수용할 수 없을 정도로 낮은 수렴 속도를 보입니다. 이러한 딜레마를 해결하기 위해, 본 논문에서는 하이브리드 순위 분할 연합 학습(HO-SFL)을 제안합니다. HO-SFL은 분할 학습 프로세스를 라그랑주 프레임워크 내에서 재구성하여 최적화 환경을 분리합니다. 서버는 정확한 1차 업데이트(즉, 역전파)를 수행하는 반면, 클라이언트는 메모리 효율적인 0차 최적화를 수행합니다. 이러한 하이브리드 설계는 클라이언트 측 역전파의 필요성을 없애는 동시에 차원 제약 없는 모델 집계를 가능하게 하여 통신 비용을 크게 줄입니다. 또한, 우리는 HO-SFL의 이론적 수렴 분석을 제공하여, HO-SFL이 0차 최적화의 차원에 의존적인 수렴 속도 저하를 완화하여 1차 방법과 유사한 수렴 속도를 달성한다는 것을 보여줍니다. 시각 및 언어 모드에서 다양한 작업에 대한 광범위한 실험 결과는 HO-SFL이 1차 기준 모델과 유사한 수렴 속도를 달성하면서도 통신 비용과 클라이언트 메모리 사용량을 크게 줄인다는 것을 입증합니다.
Fine-tuning large models on edge devices is severely hindered by the memory-intensive backpropagation (BP) in standard frameworks like federated learning and split learning. While substituting BP with zeroth-order optimization can significantly reduce memory footprints, it typically suffers from prohibitively degraded convergence speed. To resolve this dilemma, we propose Hybrid-Order Split Federated Learning (HO-SFL). By reformulating the split learning process within a Lagrangian framework, HO-SFL decouples the optimization landscape: The server performs precise first-order updates (i.e., BP), whereas clients conduct memory-efficient zeroth-order optimization. This hybrid design not only eliminates the need for client-side BP but also enables dimension-free model aggregation, drastically lowering communication costs. Crucially, we provide a theoretical convergence analysis, demonstrating that HO-SFL mitigates the dimension-dependent convergence slowdown of zeroth-order optimization, achieving a convergence rate comparable to first-order methods. Extensive experiments on tasks across vision and language modalities validate that HO-SFL achieves convergence speeds comparable to first-order baselines while significantly reducing communication costs and client memory footprints.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.