2603.20094v1 Mar 20, 2026 cs.IR

LLM 기반 의미론적 데이터 통합을 통한 항공우주 분야 전자 부품 자격 데이터 관리

LLM-Enhanced Semantic Data Integration of Electronic Component Qualifications in the Aerospace Domain

Emanuele Della Valle
Emanuele Della Valle
Politecnico di Milano
Citations: 17,500
h-index: 33
Antonio De Santis
Antonio De Santis
Politecnico di Milano
Citations: 25
h-index: 3
Marco Brambilla
Marco Brambilla
Citations: 17
h-index: 2
Marco Balduini
Marco Balduini
Citations: 575
h-index: 12
Matteo Belcao
Matteo Belcao
Citations: 11
h-index: 1
Andrea Proia
Andrea Proia
Citations: 11
h-index: 2

대규모 제조업체는 각 부서에서 관리하는 데이터 사일로로 인해 정보 검색에 어려움을 겪으며, 데이터베이스 간의 불일치 및 오류가 발생합니다. 본 논문에서는 위성 보드 설계에 사용되는 전자 부품의 자격 데이터를 통합하고 검색하는 경험을 제시합니다. 데이터 사일로로 인해 설계자는 개별 부품의 자격 상태를 즉시 확인할 수 없습니다. 그러나 이는 생산 전에 조립 도면이 발행되는 계획 단계에서 새로운 자격 부여를 최적화하고 중복 노력을 방지하는 데 매우 중요합니다. 이를 해결하기 위해, 우리는 가상 지식 그래프를 사용하여 이질적인 데이터 소스를 통합된 관점으로 제공하고, LLM을 활용하여 검색 정확도를 높이고 데이터 정제에 필요한 수동 작업을 줄이는 파이프라인을 제안합니다. 자격 정보 검색은 온톨로지 기반의 데이터 접근 방식을 사용하여 구조화된 쿼리를 수행하고, 벡터 검색 메커니즘을 사용하여 유사한 텍스트 특성을 기반으로 자격을 검색합니다. 우리는 제안된 파이프라인이 검색 증강 생성(RAG)과 같은 LLM만을 사용하는 방식보다 장기적인 효율성 측면에서 더 우수하다는 것을 보여주는 비용-편익 분석을 수행합니다.

Original Abstract

Large manufacturing companies face challenges in information retrieval due to data silos maintained by different departments, leading to inconsistencies and misalignment across databases. This paper presents an experience in integrating and retrieving qualification data for electronic components used in satellite board design. Due to data silos, designers cannot immediately determine the qualification status of individual components. However, this process is critical during the planning phase, when assembly drawings are issued before production, to optimize new qualifications and avoid redundant efforts. To address this, we propose a pipeline that uses Virtual Knowledge Graphs for a unified view over heterogeneous data sources and LLMs to enhance retrieval and reduce manual effort in data cleansing. The retrieval of qualifications is then performed through an Ontology-based Data Access approach for structured queries and a vector search mechanism for retrieving qualifications based on similar textual properties. We perform a comparative cost-benefit analysis, demonstrating that the proposed pipeline also outperforms approaches relying solely on LLMs, such as Retrieval-Augmented Generation (RAG), in terms of long-term efficiency.

0 Citations
0 Influential
16.5 Altmetric
82.5 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!