2604.17456v1 Apr 19, 2026 cs.AI

TrafficClaw: 통합 물리 환경 모델링을 통한 범용적인 도시 교통 제어

TrafficClaw: Generalizable Urban Traffic Control via Unified Physical Environment Modeling

Yansong NING
Yansong NING
The Hong Kong University of Science and Technology (Guangzhou)
Citations: 106
h-index: 6
Jindong Han
Jindong Han
Citations: 910
h-index: 18
Pan Zhang
Pan Zhang
Citations: 7
h-index: 2
Siqi Lai
Siqi Lai
Citations: 200
h-index: 6
Yuping Zhou
Yuping Zhou
Citations: 46
h-index: 2
Hao Liu
Hao Liu
Citations: 101
h-index: 5

도시 교통 제어는 교통 신호, 고속도로, 대중교통, 택시 서비스 등 다양한 하위 시스템을 포괄하는 시스템 수준의 조정 문제입니다. 기존의 최적화 기반, 강화 학습(RL) 및 최근 등장하는 LLM 기반 접근 방식은 대부분 개별적인 작업에 맞춰 설계되어 있어, 작업 간의 일반화 능력과 하위 시스템 간의 복합적인 물리적 역학 관계를 파악하는 데 한계가 있습니다. 본 연구에서는 효과적인 시스템 수준 제어를 위해서는 하위 시스템들이 인프라, 이동 수요 및 시공간적 제약을 공유하는 통합된 물리 환경이 필요하며, 이를 통해 지역적인 개입이 네트워크 전체로 전파될 수 있다고 주장합니다. 이에 따라, 본 연구에서는 통합된 런타임 환경을 기반으로 하는 범용적인 도시 교통 제어 프레임워크인 TrafficClaw를 제안합니다. TrafficClaw는 다양한 하위 시스템을 하나의 공유 동역 시스템으로 통합하여, 하위 시스템 간의 상호 작용을 명시적으로 모델링하고, 에이전트-환경 간의 폐루프 피드백을 가능하게 합니다. 이 환경 내에서, 우리는 실행 가능한 시공간 추론 및 재사용 가능한 절차적 메모리를 갖춘 LLM 에이전트를 개발하여, 하위 시스템 전반에 걸친 통합적인 진단 및 지속적인 전략 개선을 지원합니다. 또한, 지도 학습 초기화 및 시스템 수준 최적화를 통한 에이전트 기반 강화 학습을 결합한 다단계 학습 파이프라인을 도입하여, 조정된 시스템 인식 성능을 더욱 향상시킵니다. 실험 결과, TrafficClaw는 예기치 않은 교통 상황, 역학 관계 및 작업 구성에 대해 강력하고 전이 가능하며 시스템 인식적인 성능을 달성함을 보여줍니다. 본 프로젝트는 https://github.com/usail-hkust/TrafficClaw 에서 이용하실 수 있습니다.

Original Abstract

Urban traffic control is a system-level coordination problem spanning heterogeneous subsystems, including traffic signals, freeways, public transit, and taxi services. Existing optimization-based, reinforcement learning (RL), and emerging LLM-based approaches are largely designed for isolated tasks, limiting both cross-task generalization and the ability to capture coupled physical dynamics across subsystems. We argue that effective system-level control requires a unified physical environment in which subsystems share infrastructure, mobility demand, and spatiotemporal constraints, allowing local interventions to propagate through the network. To this end, we propose TrafficClaw, a framework for general urban traffic control built upon a unified runtime environment. TrafficClaw integrates heterogeneous subsystems into a shared dynamical system, enabling explicit modeling of cross-subsystem interactions and closed-loop agent-environment feedback. Within this environment, we develop an LLM agent with executable spatiotemporal reasoning and reusable procedural memory, supporting unified diagnostics across subsystems and continual strategy refinement. Furthermore, we introduce a multi-stage training pipeline with supervised initialization and agentic RL with system-level optimization, further enabling coordinated and system-aware performance. Experiments demonstrate that TrafficClaw achieves robust, transferable, and system-aware performance across unseen traffic scenarios, dynamics, and task configurations. Our project is available at https://github.com/usail-hkust/TrafficClaw.

0 Citations
0 Influential
29 Altmetric
145.0 Score
Original PDF
0

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!