CRAFT: 망각 방지 개입 기반 적응을 통한 지속적 학습
CRAFT: Forgetting-Aware Intervention-Based Adaptation for Continual Learning
대규모 언어 모델(LLM)은 미세 조정(fine-tuning)을 통해 새로운 능력을 습득할 수 있지만, 지속적인 적응은 종종 파국적인 망각(catastrophic forgetting)을 초래합니다. 본 논문에서는 CRAFT라는 지속적 학습 프레임워크를 제안합니다. CRAFT는 모델 가중치를 업데이트하는 대신, 은닉 표현(hidden representations)에 대한 저차원(low-rank) 개입(interventions)을 학습하여 망각을 방지합니다. CRAFT는 세 단계로 진행됩니다. 첫째, 각 작업을 출력 분포의 발산(divergence)을 기반으로 유사한 작업 그룹으로 라우팅합니다. 둘째, Kullback-Leibler (KL) 발산을 사용하여 작업 그룹의 이전 상태에 대한 미세 조정을 수행하며, 이는 망각을 직접적으로 제어하고 수렴을 결정합니다. 셋째, 업데이트된 작업에 대한 개입을 동일한 KL 신호를 사용하여 공유 표현(shared representation)에 병합합니다. 이러한 설계는 라우팅, 정규화 및 병합을 단일 KL 기반 목표 함수로 통합합니다. CRAFT는 다양한 벤치마크 및 모델 크기에서 강력한 LoRA 기반 접근 방식보다 전반적인 성능을 향상시키고 망각을 줄이며, 작업 순서에 대한 강건성(robustness)을 유지합니다. 이러한 결과는 출력 공간의 발산에 의해 안내되는 표현 공간에서의 적응 제어가 LLM에서 지속적 학습을 위한 확장 가능하고 체계적인 접근 방식을 제공한다는 것을 시사합니다.
Large language models (LLMs) can acquire new capabilities through fine-tuning, but continual adaptation often leads to catastrophic forgetting. We propose CRAFT, a continual learning framework that avoids updating model weights by instead learning low-rank interventions on hidden representations. CRAFT proceeds in three stages: it first routes each task to a group of similar tasks based on output-distribution divergence; it then fine-tunes the model using a Kullback-Leibler (KL) divergence against the group's prior state, which directly controls forgetting and determines convergence; finally, it merges interventions for the updated task into the shared representation using the same KL signal. This design unifies routing, regularization, and merging through a single KL-based objective. CRAFT improves overall performance and reduces forgetting compared to strong LoRA-based approaches across multiple benchmarks and model scales, while remaining robust to task ordering. These results suggest that controlling adaptation in representation space, guided by output-space divergence, provides a scalable and principled approach to continual learning in LLMs.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.