2602.02090v2 Feb 02, 2026 cs.CL

LEC-KG: LLM 임베딩 기반 협업 프레임워크를 활용한 도메인 특화 지식 그래프 구축 - 지속가능발전목표(SDGs) 사례 연구

LEC-KG: An LLM-Embedding Collaborative Framework for Domain-Specific Knowledge Graph Construction -- A Case Study on SDGs

Changhua Pei
Changhua Pei
Citations: 300
h-index: 11
Yi Zeng
Yi Zeng
Citations: 243
h-index: 8
Yingchao Piao
Yingchao Piao
Citations: 62
h-index: 4
Jianhui Li
Jianhui Li
Citations: 20
h-index: 3

비정형 텍스트로부터 도메인 특화 지식 그래프를 구축하는 것은 이질적인 개체 명칭, 긴 꼬리 분포를 갖는 관계, 그리고 표준화된 스키마의 부재로 인해 여전히 어려운 과제입니다. 본 논문에서는 대규모 언어 모델(LLM)의 의미론적 이해 능력과 지식 그래프 임베딩(KGE)의 구조적 추론 능력을 융합하는 양방향 협업 프레임워크인 LEC-KG를 제안합니다. 저희의 접근 방식은 세 가지 주요 구성 요소로 이루어집니다: (1) 긴 꼬리 편향을 완화하는 계층적 세분화 관계 추출, (2) 원본 텍스트에 기반한 증거 중심 Chain-of-Thought 피드백, 그리고 (3) 구조적 검증을 가능하게 하는 의미론적 초기화. 두 모듈은 서로 반복적으로 강화됩니다. KGE는 구조 정보를 활용하여 LLM 추출 결과를 개선하는 피드백을 제공하고, 검증된 트리플은 KGE 표현을 점진적으로 개선합니다. 저희는 중국 지속가능발전목표(SDG) 보고서를 사용하여 LEC-KG를 평가하였으며, LLM 기반 모델보다 상당한 성능 향상을 보였으며, 특히 빈도가 낮은 관계에 대한 성능 향상이 두드러졌습니다. 저희의 프레임워크는 반복적인 개선 과정을 통해 비정형 정책 텍스트를 검증된 지식 그래프 트리플로 안정적으로 변환합니다.

Original Abstract

Constructing domain-specific knowledge graphs from unstructured text remains challenging due to heterogeneous entity mentions, long-tail relation distributions, and the absence of standardized schemas. We present LEC-KG, a bidirectional collaborative framework that integrates the semantic understanding of Large Language Models (LLMs) with the structural reasoning of Knowledge Graph Embeddings (KGE). Our approach features three key components: (1) hierarchical coarse-to-fine relation extraction that mitigates long-tail bias, (2) evidence-guided Chain-of-Thought feedback that grounds structural suggestions in source text, and (3) semantic initialization that enables structural validation for unseen entities. The two modules enhance each other iteratively-KGE provides structure-aware feedback to refine LLM extractions, while validated triples progressively improve KGE representations. We evaluate LEC-KG on Chinese Sustainable Development Goal (SDG) reports, demonstrating substantial improvements over LLM baselines, particularly on low-frequency relations. Through iterative refinement, our framework reliably transforms unstructured policy text into validated knowledge graph triples.

0 Citations
0 Influential
5.5 Altmetric
27.5 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!