VISTA: 지식 기반 선박 항적 데이터 보완 및 수정 과정 추적
VISTA: Knowledge-Driven Vessel Trajectory Imputation with Repair Provenance
불완전한 항적 데이터는 시공간 분석 등 다양한 응용 분야에서 중요한 문제이며, 기존의 보완 방법들은 데이터 복원에만 집중하여 수정 과정에 대한 근거를 명확히 제시하지 못합니다. 이는 해양 이상 감지 및 경로 계획과 같이 수정된 항적이 운영 결정에 영향을 미치는 안전 관련 응용 분야에서 신뢰성을 저해할 수 있습니다. 본 연구에서는 각 수정 과정에 대한 상세한 근거를 기록하는 '수정 과정 추적(repair provenance)'을 도입하여, 단순히 데이터를 복원하는 것을 넘어 의사 결정 과정을 지원하는 방식으로 항적 데이터 보완을 수행합니다. VISTA(knowledge-driven interpretable vessel trajectory imputation)는 지식 기반의 해석 가능한 선박 항적 데이터 보완 프레임워크로, LLM(Large Language Model)의 추론 과정을 데이터 기반 지식으로 연결하여 신뢰성 있는 수정 과정 추적 정보를 제공합니다. 구체적으로, 데이터 검증이 가능한 구성 요소로 이루어진 지식 모델인 '구조화된 데이터 기반 지식(Structured Data-derived Knowledge, SDK)'을 정의하고, 이를 실제 데이터와 비교하여 검증하고 LLM이 생성하는 설명의 기준점으로 활용합니다. SDK는 '구조화된 데이터 기반 지식 그래프(Structured Data-derived Knowledge Graph, SD-KG)'로 구성되며, 대규모 AIS(Automatic Identification System) 데이터를 활용하여 데이터, 지식, 데이터의 순환 과정을 통해 정보를 추출, 검증하고 지속적으로 유지 관리합니다. 또한, 병렬 처리, 오류 방지, 중복 제어를 포함하는 워크플로우 관리 시스템을 통해 일관성 있고 효율적인 전체 프로세스를 보장합니다. 두 개의 대규모 AIS 데이터셋에 대한 실험 결과, VISTA는 기존 방법보다 5~91% 향상된 정확도를 달성하고 추론 시간을 51~93% 단축했으며, 수정 과정 추적 정보를 제공합니다. 수정 과정 추적 정보의 해석 가능성은 사례 연구 및 대화형 데모 시스템을 통해 추가적으로 검증되었습니다.
Repairing incomplete trajectory data is essential for downstream spatio-temporal applications. Yet, existing repair methods focus solely on reconstruction without documenting the reasoning behind repair decisions, undermining trust in safety-critical applications where repaired trajectories affect operational decisions, such as in maritime anomaly detection and route planning. We introduce repair provenance - structured, queryable metadata that documents the full reasoning chain behind each repair - which transforms imputation from pure data recovery into a task that supports downstream decision-making. We propose VISTA (knowledge-driven interpretable vessel trajectory imputation), a framework that reliably equips repaired trajectories with repair provenance by grounding LLM reasoning in data-verified knowledge. Specifically, we formalize Structured Data-derived Knowledge (SDK), a knowledge model whose data-verifiable components can be validated against real data and used to anchor and constrain LLM-generated explanations. We organize SDK in a Structured Data-derived Knowledge Graph (SD-KG) and establish a data-knowledge-data loop for extraction, validation, and incremental maintenance over large-scale AIS data. A workflow management layer with parallel scheduling, fault tolerance, and redundancy control ensures consistent and efficient end-to-end processing. Experiments on two large-scale AIS datasets show that VISTA achieves state-of-the-art accuracy, improving over baselines by 5-91% and reducing inference time by 51-93%, while producing repair provenance, whose interpretability is further validated through a case study and an interactive demo system.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.