LEC-KG: LLM 임베딩 기반 협업 프레임워크를 활용한 도메인 특화 지식 그래프 구축 - 지속가능발전목표(SDGs) 사례 연구
LEC-KG: An LLM-Embedding Collaborative Framework for Domain-Specific Knowledge Graph Construction -- A Case Study on SDGs
비정형 텍스트로부터 도메인 특화 지식 그래프를 구축하는 것은 이질적인 개체 명칭, 긴 꼬리 분포를 갖는 관계, 그리고 표준화된 스키마의 부재로 인해 여전히 어려운 과제입니다. 본 논문에서는 대규모 언어 모델(LLM)의 의미론적 이해 능력과 지식 그래프 임베딩(KGE)의 구조적 추론 능력을 융합하는 양방향 협업 프레임워크인 LEC-KG를 제안합니다. 저희의 접근 방식은 세 가지 주요 구성 요소로 이루어집니다: (1) 긴 꼬리 편향을 완화하는 계층적 세분화 관계 추출, (2) 원본 텍스트에 기반한 증거 중심 Chain-of-Thought 피드백, 그리고 (3) 구조적 검증을 가능하게 하는 의미론적 초기화. 두 모듈은 서로 반복적으로 강화됩니다. KGE는 구조 정보를 활용하여 LLM 추출 결과를 개선하는 피드백을 제공하고, 검증된 트리플은 KGE 표현을 점진적으로 개선합니다. 저희는 중국 지속가능발전목표(SDG) 보고서를 사용하여 LEC-KG를 평가하였으며, LLM 기반 모델보다 상당한 성능 향상을 보였으며, 특히 빈도가 낮은 관계에 대한 성능 향상이 두드러졌습니다. 저희의 프레임워크는 반복적인 개선 과정을 통해 비정형 정책 텍스트를 검증된 지식 그래프 트리플로 안정적으로 변환합니다.
Constructing domain-specific knowledge graphs from unstructured text remains challenging due to heterogeneous entity mentions, long-tail relation distributions, and the absence of standardized schemas. We present LEC-KG, a bidirectional collaborative framework that integrates the semantic understanding of Large Language Models (LLMs) with the structural reasoning of Knowledge Graph Embeddings (KGE). Our approach features three key components: (1) hierarchical coarse-to-fine relation extraction that mitigates long-tail bias, (2) evidence-guided Chain-of-Thought feedback that grounds structural suggestions in source text, and (3) semantic initialization that enables structural validation for unseen entities. The two modules enhance each other iteratively-KGE provides structure-aware feedback to refine LLM extractions, while validated triples progressively improve KGE representations. We evaluate LEC-KG on Chinese Sustainable Development Goal (SDG) reports, demonstrating substantial improvements over LLM baselines, particularly on low-frequency relations. Through iterative refinement, our framework reliably transforms unstructured policy text into validated knowledge graph triples.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.