2605.01901v1 May 03, 2026 cs.CV

다중 작업 교통 디지털 트윈을 위한 행동 기반 차선 표현 학습

Behavior-Grounded Lane Representation Learning for Multi-Task Traffic Digital Twins

Pei Li
Pei Li
Citations: 25
h-index: 2
B. Ran
B. Ran
Citations: 131
h-index: 5
Rei Tamaru
Rei Tamaru
Citations: 9
h-index: 2

교통 디지털 트윈은 고급 교통 관리에 강력한 도구이지만, 대부분의 시스템은 정적인 기하학적 표현에 기반합니다. 그러나 이러한 표현 방식은 복잡한 교통 상황에서 차선이 어떻게 작동하는지와 같이 행동을 고려한 추론에 필요한 동적인 기능적 의미를 포착하지 못합니다. 이러한 간극을 해소하기 위해, 우리는 교통 디지털 트윈을 위한 행동 기반 차선 표현 학습 프레임워크인 GeoLaneRep을 소개합니다. GeoLaneRep은 정적인 차선 기하학 정보, 관찰된 차량 궤적, 그리고 운영 관련 정보를 하나의 공유된, 카메라 간의 의미적 임베딩으로 함께 인코딩합니다. 이 인코더는 대조적인 카메라 간 정렬, 보조 역할 감독, 그리고 시간적 이상 감지를 결합한 공동 목표를 통해 학습됩니다. 16대의 도로변 카메라와 132개의 차선을 대상으로 실험한 결과, 학습된 임베딩은 제로샷 카메라 간 매칭에서 $0.004$의 측면 순위 오차와 $1.000$의 엣지-역할 F1 점수를 달성했으며, 윈도우 레벨의 이상 감지에서 $0.991$의 AUROC를 보였습니다. 또한, 동일한 행동 기반 임베딩을 사용하여 확산 모델 기반 생성기를 통해 특정 운영 사양을 만족하는 차선 기하학을 생성할 수 있으며, 38개의 차선 그룹에 대해 전체적으로 $87.9%$의 사양 정확도를 달성했습니다. 따라서 GeoLaneRep은 도로변 관측 정보와 하위 시스템 디지털 트윈 작업 간의 의미적 인터페이스를 제공하여, 카메라 간 이전, 행동 기반 모니터링 및 목표 지향적인 차선 생성을 지원합니다. 이 프레임워크는 https://github.com/raynbowy23/GeoLaneRep 에서 공개적으로 사용할 수 있습니다.

Original Abstract

Traffic digital twins are powerful tools for advanced traffic management, and most systems are built on static geometric representations. However, these representations fail to capture the dynamic functional semantics required for behavior-aware reasoning, such as how a lane operates under complex traffic conditions. To address this gap, we introduce GeoLaneRep, a behavior-grounded lane representation learning framework for traffic digital twins. GeoLaneRep jointly encodes static lane geometry, observed vehicle trajectories, and operational descriptors into a shared, cross-camera semantic embedding. The encoder is trained with a joint objective combining contrastive cross-camera alignment, auxiliary role supervision, and temporal anomaly detection. Across 16 roadside cameras and 132 lanes, the learned embeddings achieve a $0.004$ lateral-rank error and an edge-role F1 of $1.000$ in zero-shot cross-camera matching, and an AUROC of $0.991$ for window-level anomaly detection. We further show that the same behavioral embeddings can condition a diffusion-based generator to synthesize lane geometries that satisfy targeted operational specifications, with $87.9\%$ overall specification accuracy across 38 lane groups. GeoLaneRep thus provides a semantic interface between roadside observations and downstream digital twin tasks, supporting cross-camera transfer, behavior-aware monitoring, and goal-directed lane synthesis. The framework is openly available at https://github.com/raynbowy23/GeoLaneRep.

0 Citations
0 Influential
22.5 Altmetric
112.5 Score
Original PDF
0

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!