SCL-GNN: 오해로운 상관관계 학습을 통한 일반화 가능한 그래프 신경망
SCL-GNN: Towards Generalizable Graph Neural Networks via Spurious Correlation Learning
그래프 신경망(GNN)은 다양한 작업에서 뛰어난 성능을 보여주었습니다. 그러나 GNN의 일반화 능력은 종종 그래프 내의 노드 특징과 레이블 간의 오해로운 상관관계에 의해 저해됩니다. 우리의 분석에 따르면, GNN은 예측에 신뢰성이 없는 경우에도 학습 데이터 내의 미세한 통계적 상관관계를 활용하는 경향이 있습니다. 이러한 문제를 해결하기 위해, 우리는 독립적이고 동일한 분포(IID) 및 분포 외부(OOD) 그래프 모두에서 일반화를 향상시키도록 설계된 새로운 프레임워크인 오해로운 상관관계 학습 그래프 신경망(SCL-GNN)을 제안합니다. SCL-GNN은 힐베르트-슈미트 독립성 기준(HSIC)을 활용하여 노드 표현과 클래스 점수 간의 상관관계를 정량화하는 체계적인 오해로운 상관관계 학습 메커니즘을 통합합니다. 이를 통해 모델은 관련 없는 영향을 미치는 오해로운 상관관계를 식별하고 완화할 수 있습니다. 또한, 우리는 모듈과 GNN 파라미터를 동시에 최적화하는 효율적인 양층 최적화 전략을 도입하여 과적합을 방지합니다. 실제 및 합성 데이터 세트에 대한 광범위한 실험 결과, SCL-GNN은 다양한 분포 변화 조건에서 최첨단 기준 모델보다 일관되게 우수한 성능을 보여주며, 이는 SCL-GNN의 견고성 및 일반화 능력을 강조합니다.
Graph Neural Networks (GNNs) have demonstrated remarkable success across diverse tasks. However, their generalization capability is often hindered by spurious correlations between node features and labels in the graph. Our analysis reveals that GNNs tend to exploit imperceptible statistical correlations in training data, even when such correlations are unreliable for prediction. To address this challenge, we propose the Spurious Correlation Learning Graph Neural Network (SCL-GNN), a novel framework designed to enhance generalization on both Independent and Identically Distributed (IID) and Out-of-Distribution (OOD) graphs. SCL-GNN incorporates a principled spurious correlation learning mechanism, leveraging the Hilbert-Schmidt Independence Criterion (HSIC) to quantify correlations between node representations and class scores. This enables the model to identify and mitigate irrelevant but influential spurious correlations effectively. Additionally, we introduce an efficient bi-level optimization strategy to jointly optimize modules and GNN parameters, preventing overfitting. Extensive experiments on real-world and synthetic datasets demonstrate that SCL-GNN consistently outperforms state-of-the-art baselines under various distribution shifts, highlighting its robustness and generalization capabilities.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.