결정 경계 인지 생성: 불균형 데이터 학습을 위한 방법
Decision Boundary-aware Generation for Long-tailed Learning
불균형 데이터는 결정 경계를 주로 주요 클래스 쪽으로 편향시켜 소수 클래스의 정확도를 저하시킵니다. 확산 모델 기반의 생성적 증강은 추가 데이터를 생성하여 이 문제를 해결하지만, 주요 클래스에서 소수 클래스로의 전이는 불균형 데이터셋에서 발생하는 생성기의 편향을 더욱 완화합니다. 그러나 본 논문에서는 주요-소수 클래스 전이가 분류기의 결정 공간 균형을 맞추는 데 도움이 되지만, 동시에 잠재적인 비지역적 특징 혼합을 유발하여 클래스 간 특징을 얽히게 하고, 결정 경계 겹침과 소수 클래스 분포 변화를 초래한다는 것을 보여줍니다. 이러한 문제를 해결하기 위해, 우리는 먼저 결정 경계의 모호성을 식별하고, 정보적인 경계 근처 샘플을 생성하여 경계 근처 표현 학습을 촉진하는 Decision Boundary-aware Generation (DBG) 프레임워크를 제안합니다. DBG는 전체적으로 불균형 데이터셋을 재균형화하고, 불균형 데이터 학습을 위한 더 분리 가능한 결정 공간을 제공합니다. 표준 불균형 데이터 벤치마크에서 DBG는 일관되게 소수 클래스와 전체 정확도를 향상시키고, 클래스 간 겹침을 줄입니다. DBG의 코드는 https://github.com/keepdigitalabc-svg/DBG 에서 확인할 수 있습니다.
Long-tailed data bias decision boundaries toward head classes and degrade tail class accuracy. Diffusion-based generative augmentation address this problem by generating additional data, while head-to-tail transfer further mitigate the generator bias inherit from long-tailed dataset. However, we show that while head-to-tail transfer helps balance the decision space of the classifier, it also induces latent non-local feature mixing that entangles inter-class features, causing decision boundary overlap and tail class distribution shift. To address this, we first identify the problem of boundary ambiguity and then propose Decision Boundary-aware Generation (DBG) framework, which promotes near-boundary representation learning by generating informative near-boundary samples. Overall, DBG rebalances the long-tailed dataset while yielding more separable decision space for long-tailed learning. Across standard long-tailed benchmarks, DBG consistently improves tail class and overall accuracy with less inter-class overlap. The code of DBG is available at https://github.com/keepdigitalabc-svg/DBG.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.