2605.01468v1 May 02, 2026 cs.CV

결정 경계 인지 생성: 불균형 데이터 학습을 위한 방법

Decision Boundary-aware Generation for Long-tailed Learning

Xinyi Shang
Xinyi Shang
Citations: 22
h-index: 2
Jiacheng Yang
Jiacheng Yang
Citations: 1
h-index: 1
Ruichi Zhang
Ruichi Zhang
Citations: 77
h-index: 3
Chikai Shang
Chikai Shang
Citations: 11
h-index: 2
Mengke Li
Mengke Li
Citations: 586
h-index: 12
Jun Gao
Jun Gao
Citations: 1
h-index: 1
Yonggang Zhang
Yonggang Zhang
Citations: 14
h-index: 2
Yang Lu
Yang Lu
Citations: 16
h-index: 2

불균형 데이터는 결정 경계를 주로 주요 클래스 쪽으로 편향시켜 소수 클래스의 정확도를 저하시킵니다. 확산 모델 기반의 생성적 증강은 추가 데이터를 생성하여 이 문제를 해결하지만, 주요 클래스에서 소수 클래스로의 전이는 불균형 데이터셋에서 발생하는 생성기의 편향을 더욱 완화합니다. 그러나 본 논문에서는 주요-소수 클래스 전이가 분류기의 결정 공간 균형을 맞추는 데 도움이 되지만, 동시에 잠재적인 비지역적 특징 혼합을 유발하여 클래스 간 특징을 얽히게 하고, 결정 경계 겹침과 소수 클래스 분포 변화를 초래한다는 것을 보여줍니다. 이러한 문제를 해결하기 위해, 우리는 먼저 결정 경계의 모호성을 식별하고, 정보적인 경계 근처 샘플을 생성하여 경계 근처 표현 학습을 촉진하는 Decision Boundary-aware Generation (DBG) 프레임워크를 제안합니다. DBG는 전체적으로 불균형 데이터셋을 재균형화하고, 불균형 데이터 학습을 위한 더 분리 가능한 결정 공간을 제공합니다. 표준 불균형 데이터 벤치마크에서 DBG는 일관되게 소수 클래스와 전체 정확도를 향상시키고, 클래스 간 겹침을 줄입니다. DBG의 코드는 https://github.com/keepdigitalabc-svg/DBG 에서 확인할 수 있습니다.

Original Abstract

Long-tailed data bias decision boundaries toward head classes and degrade tail class accuracy. Diffusion-based generative augmentation address this problem by generating additional data, while head-to-tail transfer further mitigate the generator bias inherit from long-tailed dataset. However, we show that while head-to-tail transfer helps balance the decision space of the classifier, it also induces latent non-local feature mixing that entangles inter-class features, causing decision boundary overlap and tail class distribution shift. To address this, we first identify the problem of boundary ambiguity and then propose Decision Boundary-aware Generation (DBG) framework, which promotes near-boundary representation learning by generating informative near-boundary samples. Overall, DBG rebalances the long-tailed dataset while yielding more separable decision space for long-tailed learning. Across standard long-tailed benchmarks, DBG consistently improves tail class and overall accuracy with less inter-class overlap. The code of DBG is available at https://github.com/keepdigitalabc-svg/DBG.

0 Citations
0 Influential
26 Altmetric
130.0 Score
Original PDF
0

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!