2603.13830v1 Mar 14, 2026 cs.AI

BSC 밈 토큰의 조기 '러그 풀' 경고를 위한 다중 세분화 수준의 위장 거래 패턴 프로파일링

Early Rug Pull Warning for BSC Meme Tokens via Multi-Granularity Wash-Trading Pattern Profiling

Wei Yang
Wei Yang
Citations: 44
h-index: 4
Dingding Cao
Dingding Cao
Citations: 5
h-index: 2
Bianbian Jiao
Bianbian Jiao
Citations: 0
h-index: 0
Jingzong Yang
Jingzong Yang
Citations: 34
h-index: 5
Yujin Zhong
Yujin Zhong
Citations: 0
h-index: 0

탈중앙화 금융(DeFi)에서 밈 토큰의 높은 발행 빈도와 짧은 투자 기간은 '러그 풀' 위험을 크게 증폭시킵니다. 기존 접근 방식은 여전히 희소한 이상 현상, 불완전한 레이블, 제한된 해석 가능성으로 인해 안정적인 조기 경고를 제공하는 데 어려움을 겪습니다. 이러한 문제를 해결하기 위해, BSC 밈 토큰을 위한 엔드 투 엔드 경고 프레임워크를 제안합니다. 이 프레임워크는 데이터셋 구축 및 레이블링, 위장 거래 패턴 특징 모델링, 위험 예측, 그리고 오류 분석의 네 가지 단계로 구성됩니다. 방법론적으로, 세 가지 위장 거래 패턴(자기 거래, 매칭 거래, 순환 거래)을 기반으로 12개의 토큰 수준 행동 특징을 구성하여 거래, 주소, 그리고 흐름 수준의 신호를 위험 벡터로 통합합니다. 지도 학습 모델을 사용하여 경고 점수를 출력하고 경고 결정을 내립니다. 현재 설정(7개의 토큰, 33,242개의 레코드)에서, 랜덤 포레스트는 로지스틱 회귀보다 핵심 지표에서 더 우수한 성능을 보입니다. AUC=0.9098, PR-AUC=0.9185, 그리고 F1=0.7429를 달성했습니다. 제거 실험 결과, 거래 수준 특징이 성능 향상에 가장 큰 영향을 미칩니다(제거 시 Delta PR-AUC=-0.1843). 반면, 주소 수준 특징은 안정적인 추가적인 이점을 제공합니다(제거 시 Delta PR-AUC=-0.0573). 또한, 이 모델은 특정 샘플에 대해 실행 가능한 조기 경고 잠재력을 보여주며, 평균 선행 시간(v1)은 3.8133시간입니다. 오류 프로파일(FP=1, FN=8)은 현재 시스템이 높은 정확도를 갖는 선별 도구로 더 적합하며, 높은 재현율을 갖는 자동 경고 시스템으로는 덜 적합함을 나타냅니다. 주요 기여는 세 가지입니다. 첫째, 실행 가능하고 재현 가능한 '러그 풀' 경고 파이프라인입니다. 둘째, 약한 감독 하에서 다중 세분화 수준의 위장 거래 특징에 대한 실증적 검증입니다. 셋째, 선행 시간 및 오류 경계 분석을 통한 배포 지향적인 증거입니다.

Original Abstract

The high-frequency issuance and short-cycle speculation of meme tokens in decentralized finance (DeFi) have significantly amplified rug-pull risk. Existing approaches still struggle to provide stable early warning under scarce anomalies, incomplete labels, and limited interpretability. To address this issue, an end-to-end warning framework is proposed for BSC meme tokens, consisting of four stages: dataset construction and labeling, wash-trading pattern feature modeling, risk prediction, and error analysis. Methodologically, 12 token-level behavioral features are constructed based on three wash-trading patterns (Self, Matched, and Circular), unifying transaction-, address-, and flow-level signals into risk vectors. Supervised models are then employed to output warning scores and alert decisions. Under the current setting (7 tokens, 33,242 records), Random Forest outperforms Logistic Regression on core metrics, achieving AUC=0.9098, PR-AUC=0.9185, and F1=0.7429. Ablation results show that trade-level features are the primary performance driver (Delta PR-AUC=-0.1843 when removed), while address-level features provide stable complementary gain (Delta PR-AUC=-0.0573). The model also demonstrates actionable early-warning potential for a subset of samples, with a mean Lead Time (v1) of 3.8133 hours. The error profile (FP=1, FN=8) indicates that the current system is better positioned as a high-precision screener rather than a high-recall automatic alarm engine. The main contributions are threefold: an executable and reproducible rug-pull warning pipeline, empirical validation of multi-granularity wash-trading features under weak supervision, and deployment-oriented evidence through lead-time and error-bound analysis.

0 Citations
0 Influential
2.5 Altmetric
12.5 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!