2602.20019v1 Feb 23, 2026 cs.LG

제한된 지도 환경에서 동적 그래프를 위한 판별력 있고 일반화 가능한 이상 탐지기 학습

Learning Discriminative and Generalizable Anomaly Detector for Dynamic Graph with Limited Supervision

Fengran Mo
Fengran Mo
University of Montreal
Citations: 798
h-index: 16
Yuxing Tian
Yuxing Tian
Citations: 2
h-index: 1
Weixu Zhang
Weixu Zhang
Citations: 53
h-index: 1
Jian-Yun Nie
Jian-Yun Nie
Citations: 353
h-index: 10
Yiyan Qi
Yiyan Qi
Citations: 196
h-index: 5
Jian Guo
Jian Guo
Citations: 16
h-index: 2

동적 그래프 이상 탐지(DGAD)는 많은 실제 응용 분야에서 매우 중요하지만, 레이블이 지정된 이상 데이터의 부족으로 인해 여전히 까다로운 과제로 남아 있다. 기존 방법론들은 비지도 학습이거나 준지도 학습이다. 비지도 학습 방법은 레이블이 지정된 이상 데이터의 필요성을 피하지만 종종 모호한 경계를 생성하는 반면, 준지도 학습 방법은 제한된 레이블링된 이상 데이터에 과적합될 수 있으며 미관측(unseen) 이상 데이터에 대해 일반화 성능이 떨어진다. 이러한 간극을 해소하기 위해 본 논문은 DGAD에서 그동안 충분히 탐구되지 않았던 문제를 고려한다. 이는 정상/미분류 데이터로부터 판별력 있는 경계를 학습하는 동시에, 미관측 이상 데이터에 대한 일반화 성능을 희생하지 않으면서 제한된 레이블링 이상 데이터를 \textbf{사용 가능할 때} 활용하는 것이다. 이를 위해 우리는 다음 세 가지 주요 구성 요소를 갖춘 효과적이고 일반화 가능하며 모델에 구애받지 않는(model-agnostic) 프레임워크를 제안한다: (i) 현재 상호작용과 과거 문맥 사이의 편차를 포착하여 이상 관련 신호를 제공하는 잔차 표현 인코딩(residual representation encoding), (ii) 정상 표현을 동일한 중심을 가진 두 초구(hypersphere)로 경계가 지정된 구간 내에 제한하여 일관된 스케일을 보장하는 동시에 이상 데이터를 분리 가능하게 유지하는 제한 손실(restriction loss), (iii) 정규화 흐름(normalizing flow)으로 모델링된 정상 로그 우도 분포를 사용하여 판별력 있고 강건한 경계를 학습하는 이중 경계(bi-boundary) 최적화 전략. 광범위한 실험을 통해 다양한 평가 환경에서 본 프레임워크의 우수성을 입증한다.

Original Abstract

Dynamic graph anomaly detection (DGAD) is critical for many real-world applications but remains challenging due to the scarcity of labeled anomalies. Existing methods are either unsupervised or semi-supervised: unsupervised methods avoid the need for labeled anomalies but often produce ambiguous boundary, whereas semi-supervised methods can overfit to the limited labeled anomalies and generalize poorly to unseen anomalies. To address this gap, we consider a largely underexplored problem in DGAD: learning a discriminative boundary from normal/unlabeled data, while leveraging limited labeled anomalies \textbf{when available} without sacrificing generalization to unseen anomalies. To this end, we propose an effective, generalizable, and model-agnostic framework with three main components: (i) residual representation encoding that capture deviations between current interactions and their historical context, providing anomaly-relevant signals; (ii) a restriction loss that constrain the normal representations within an interval bounded by two co-centered hyperspheres, ensuring consistent scales while keeping anomalies separable; (iii) a bi-boundary optimization strategy that learns a discriminative and robust boundary using the normal log-likelihood distribution modeled by a normalizing flow. Extensive experiments demonstrate the superiority of our framework across diverse evaluation settings.

0 Citations
0 Influential
8 Altmetric
40.0 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!