2604.17420v1 Apr 19, 2026 cs.LG

TransXion: 현실적인 자금세탁 방지를 위한 고정밀 그래프 벤치마크

TransXion: A High-Fidelity Graph Benchmark for Realistic Anti-Money Laundering

Guangnan Ye
Guangnan Ye
Citations: 88
h-index: 5
Hongfeng Chai
Hongfeng Chai
Citations: 98
h-index: 5
Weiqi Luo
Weiqi Luo
Citations: 205
h-index: 11
Keyang Chen
Keyang Chen
Citations: 1
h-index: 1
Zaiyuan Chen
Zaiyuan Chen
Citations: 2
h-index: 1
Zhixin Li
Zhixin Li
Citations: 31
h-index: 3
Sen Liu
Sen Liu
Citations: 150
h-index: 5
Mingxu Jiang
Mingxu Jiang
Citations: 15
h-index: 2
Yongsheng Zhao
Yongsheng Zhao
Citations: 81
h-index: 4
Zeping Li
Zeping Li
Citations: 31
h-index: 4
Yinan Jing
Yinan Jing
Citations: 592
h-index: 14
Xihong Wu
Xihong Wu
Citations: 2
h-index: 1

자금세탁은 글로벌 금융 시스템에 심각한 위험을 초래하며, 거래 감시를 위한 머신러닝의 광범위한 도입을 촉진하고 있습니다. 하지만 현실적인 벤치마크의 부족으로 인해 발전이 제한되어 있습니다. 기존의 거래 그래프 데이터셋은 다음과 같은 두 가지 주요한 한계를 가지고 있습니다. (i) 익명화된 식별자를 넘어 노드 수준의 의미 정보를 거의 제공하지 않으며, (ii) 템플릿 기반의 이상 징후 삽입에 의존하여 벤치마크가 정적인 구조적 패턴에 편향되고, 모델의 견고성에 대한 지나치게 낙관적인 평가를 초래합니다. 본 연구에서는 자금세탁 방지(AML) 연구를 위한 벤치마크 시스템인 TransXion을 제안합니다. TransXion은 정상 활동의 프로필 기반 시뮬레이션과 확률적이고 템플릿 기반이 아닌 불법 서브그래프 합성을 통합합니다. TransXion은 지속적인 개체 프로필과 조건부 거래 동작을 함께 모델링하여, 개체의 사회경제적 맥락과 모순되는 관찰된 활동인 "비정상적인" 이상 징후를 평가할 수 있도록 합니다. 결과적으로 생성된 데이터셋은 약 3백만 건의 거래를 포함하며, 5만 개의 개체로 구성되어 있으며, 각 개체는 풍부한 인구 통계 및 행동 속성을 가지고 있습니다. 실증 분석 결과, TransXion은 지불 네트워크의 주요 구조적 특성을 재현하며, 여기에는 특이한 활동 분포와 국소적인 서브그래프 구조가 포함됩니다. 다양한 알고리즘 패러다임을 포괄하는 다양한 탐지 모델에 대해, TransXion은 널리 사용되는 벤치마크보다 현저히 낮은 탐지 성능을 보여주며, 이는 더 높은 난이도와 현실성을 입증합니다. TransXion은 맥락을 인식하고 견고한 AML 탐지 방법을 개발하기 위한 보다 신뢰할 수 있는 테스트 환경을 제공합니다. 데이터셋 및 코드는 https://github.com/chaos-max/TransXion 에서 공개적으로 이용할 수 있습니다.

Original Abstract

Money laundering poses severe risks to global financial systems, driving the widespread adoption of machine learning for transaction monitoring. However, progress remains stifled by the lack of realistic benchmarks. Existing transaction-graph datasets suffer from two pervasive limitations: (i) they provide sparse node-level semantics beyond anonymized identifiers, and (ii) they rely on template-driven anomaly injection, which biases benchmarks toward static structural motifs and yields overly optimistic assessments of model robustness. We propose TransXion, a benchmark ecosystem for Anti-Money Laundering (AML) research that integrates profile-aware simulation of normal activity with stochastic, non-template synthesis of illicit subgraphs.TransXion jointly models persistent entity profiles and conditional transaction behavior, enabling evaluation of "out-of-character" anomalies where observed activity contradicts an entity's socio-economic context. The resulting dataset comprises approximately 3 million transactions among 50,000 entities, each endowed with rich demographic and behavioral attributes. Empirical analyses show that TransXion reproduces key structural properties of payment networks, including heavy-tailed activity distributions and localized subgraph structure. Across a diverse array of detection models spanning multiple algorithmic paradigms, TransXion yields substantially lower detection performance than widely used benchmarks, demonstrating increased difficulty and realism. TransXion provides a more faithful testbed for developing context-aware and robust AML detection methods. The dataset and code are publicly available at https://github.com/chaos-max/TransXion.

0 Citations
0 Influential
27 Altmetric
135.0 Score
Original PDF
0

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!