2601.01663v1 Jan 04, 2026 cs.LG

가변 길이 경로에 대한 길이 인식적 적대적 학습: 쇼핑몰 방문 경로 디지털 트윈

Length-Aware Adversarial Training for Variable-Length Trajectories: Digital Twins for Mall Shopper Paths

He Sun
He Sun
Citations: 85
h-index: 4
Jiwoong Shin
Jiwoong Shin
Citations: 11
h-index: 2
Ravi K. Dhar
Ravi K. Dhar
Citations: 15,774
h-index: 53

본 연구에서는 다운스트림 시뮬레이션 및 반사실 분석을 위한 extit{가변 길이 경로} (방문 위치/항목의 시퀀스와 관련된 타임스탬프)의 생성 모델링을 다룹니다. 실질적인 문제점은 표준 미니 배치 학습이 경로 길이에 큰 차이가 있을 때 불안정해질 수 있다는 점이며, 이는 경로에서 파생된 통계의 extit{분포 일치}를 저하시킨다는 것입니다. 본 연구에서는 extbf{길이 인식적 샘플링 (LAS)}이라는 간단한 배치 전략을 제안합니다. LAS는 경로를 길이에 따라 그룹화하고, 단일 길이 그룹에서 배치를 샘플링하여 배치 내의 길이 이질성을 줄입니다 (이를 통해 업데이트를 더욱 일관성 있게 만듭니다). LAS를 조건부 경로 GAN에 통합하고, 보조 시간 정렬 손실을 사용하며, (i) 경미한 경계 조건 하에서 파생 변수에 대한 분포 수준의 보장을 제공하고, (ii) IPM/Wasserstein 메커니즘을 통해 LAS가 길이 정보만을 사용하는 단순한 비판자를 제거하고, 그룹 내 불일치에 집중함으로써 분포 일치를 개선하는 이유를 설명합니다. 실험적으로, LAS는 쇼핑몰 방문 경로 데이터 세트 및 다양한 공개 시퀀스 데이터 세트 (GPS, 교육, 전자 상거래, 영화)에서 파생 변수 분포의 일치를 지속적으로 개선하며, 데이터 세트별 지표에서 랜덤 샘플링보다 우수한 성능을 보입니다.

Original Abstract

We study generative modeling of \emph{variable-length trajectories} -- sequences of visited locations/items with associated timestamps -- for downstream simulation and counterfactual analysis. A recurring practical issue is that standard mini-batch training can be unstable when trajectory lengths are highly heterogeneous, which in turn degrades \emph{distribution matching} for trajectory-derived statistics. We propose \textbf{length-aware sampling (LAS)}, a simple batching strategy that groups trajectories by length and samples batches from a single length bucket, reducing within-batch length heterogeneity (and making updates more consistent) without changing the model class. We integrate LAS into a conditional trajectory GAN with auxiliary time-alignment losses and provide (i) a distribution-level guarantee for derived variables under mild boundedness assumptions, and (ii) an IPM/Wasserstein mechanism explaining why LAS improves distribution matching by removing length-only shortcut critics and targeting within-bucket discrepancies. Empirically, LAS consistently improves matching of derived-variable distributions on a multi-mall dataset of shopper trajectories and on diverse public sequence datasets (GPS, education, e-commerce, and movies), outperforming random sampling across dataset-specific metrics.

0 Citations
0 Influential
26.5 Altmetric
132.5 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!