동적 지식 공간을 활용한 자율 주행 시스템의 혼동 제거 기반 지속적 학습
Deconfounded Lifelong Learning for Autonomous Driving via Dynamic Knowledge Spaces
종단 간(End-to-End) 자율 주행 시스템은 지속적 학습 과정에서 파국적 망각(catastrophic forgetting), 다양한 시나리오 간 지식 이전의 어려움, 그리고 관찰 불가능한 혼란 변수와 실제 주행 의도 간의 인과 관계 왜곡과 같은 문제에 직면합니다. 이러한 문제점을 해결하기 위해, 우리는 디리클레 프로세스 혼합 모델(Dirichlet process mixture model, DPMM)과 인과 추론의 프론트-도어 조정(front-door adjustment) 메커니즘을 통합한 혼동 제거 기반 지속적 학습 프레임워크인 DeLL을 제안합니다. DPMM은 명시적인 주행 행동을 클러스터링하는 경로 지식 공간과 잠재적인 주행 능력을 발견하는 암묵적 특징 지식 공간이라는 두 가지 동적 지식 공간을 구축하는 데 사용됩니다. DPMM의 비모수 베이지안 특성을 활용하여, 우리의 프레임워크는 클러스터 수를 미리 정의하지 않고 지식을 적응적으로 확장하고 점진적으로 업데이트하여 파국적 망각을 완화합니다. 동시에, 프론트-도어 조정 메커니즘은 DPMM에서 파생된 지식을 유효한 매개 변수로 활용하여 센서 노이즈나 환경 변화로 인해 발생하는 인과 관계 왜곡을 제거하고, 학습된 표현의 인과적 표현력을 향상시킵니다. 또한, 비-자기 회귀(non-autoregressive) 계획을 가능하게 하는 진화적 경로 디코더를 도입했습니다. 자율 주행 시스템의 지속적 학습 성능을 평가하기 위해, 우리는 Bench2Drive를 기반으로 새로운 평가 프로토콜과 지표를 제안합니다. 폐쇄 루프 CARLA 시뮬레이터에서 수행된 광범위한 실험 결과는, 우리의 프레임워크가 새로운 주행 시나리오에 대한 적응성을 크게 향상시키고 전체적인 주행 성능을 개선하며, 동시에 이전 학습된 지식을 효과적으로 유지한다는 것을 보여줍니다.
End-to-End autonomous driving (E2E-AD) systems face challenges in lifelong learning, including catastrophic forgetting, difficulty in knowledge transfer across diverse scenarios, and spurious correlations between unobservable confounders and true driving intents. To address these issues, we propose DeLL, a Deconfounded Lifelong Learning framework that integrates a Dirichlet process mixture model (DPMM) with the front-door adjustment mechanism from causal inference. The DPMM is employed to construct two dynamic knowledge spaces: a trajectory knowledge space for clustering explicit driving behaviors and an implicit feature knowledge space for discovering latent driving abilities. Leveraging the non-parametric Bayesian nature of DPMM, our framework enables adaptive expansion and incremental updating of knowledge without predefining the number of clusters, thereby mitigating catastrophic forgetting. Meanwhile, the front-door adjustment mechanism utilizes the DPMM-derived knowledge as valid mediators to deconfound spurious correlations, such as those induced by sensor noise or environmental changes, and enhances the causal expressiveness of the learned representations. Additionally, we introduce an evolutionary trajectory decoder that enables non-autoregressive planning. To evaluate the lifelong learning performance of E2E-AD, we propose new evaluation protocols and metrics based on Bench2Drive. Extensive evaluations in the closed-loop CARLA simulator demonstrate that our framework significantly improves adaptability to new driving scenarios and overall driving performance, while effectively retaining previous acquired knowledge.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.