EHRAG: 하이브리드 하이퍼그래프 구축 및 검색을 통한 경량 GraphRAG의 의미 격차 해소
EHRAG: Bridging Semantic Gaps in Lightweight GraphRAG via Hybrid Hypergraph Construction and Retrieval
Graph 기반 검색 증강 생성(GraphRAG)은 코퍼스를 그래프로 구조화하여 다중 홉 추론을 용이하게 함으로써 LLM의 성능을 향상시킵니다. 최근 경량화된 접근 방식은 명명 개체 인식(NER)을 활용하여 인덱싱 비용을 줄이지만, 구조적 공존에만 의존하여 분리된 개체 간의 잠재적인 의미 연결을 포착하지 못합니다. 이러한 문제를 해결하기 위해, 우리는 구조와 의미 수준의 관계를 모두 포착하는 하이퍼그래프를 구축하고 하이브리드 구조-의미 검색 메커니즘을 사용하는 경량 RAG 프레임워크인 EHRAG를 제안합니다. 구체적으로, EHRAG는 경량 엔티티 추출을 기반으로 문장 수준의 공존을 활용하여 구조적 하이퍼에지를 구축하고, 엔티티 텍스트 임베딩을 클러스터링하여 의미적 하이퍼에지를 구축하여 하이퍼그래프가 구조적 및 의미적 정보를 모두 포함하도록 합니다. 검색 과정에서, EHRAG는 주제 인식 점수와 개인화된 페이지랭크(PPR) 정제를 활용한 구조-의미 하이브리드 확산을 수행하여 상위 k개의 관련 문서를 식별합니다. 네 가지 데이터 세트에 대한 실험 결과, EHRAG는 최첨단 기준 성능을 능가하면서도 선형 인덱싱 복잡도를 유지하고 구축 과정에서 토큰 소비가 0임을 보여주었습니다. 코드 및 관련 정보는 다음 링크에서 확인할 수 있습니다: https://github.com/yfsong00/EHRAG.
Graph-based Retrieval-Augmented Generation (GraphRAG) enhances LLMs by structuring corpus into graphs to facilitate multi-hop reasoning. While recent lightweight approaches reduce indexing costs by leveraging Named Entity Recognition (NER), they rely strictly on structural co-occurrence, failing to capture latent semantic connections between disjoint entities. To address this, we propose EHRAG, a lightweight RAG framework that constructs a hypergraph capturing both structure and semantic level relationships, employing a hybrid structural-semantic retrieval mechanism. Specifically, EHRAG constructs structural hyperedges based on sentence-level co-occurrence with lightweight entity extraction and semantic hyperedges by clustering entity text embeddings, ensuring the hypergraph encompasses both structural and semantic information. For retrieval, EHRAG performs a structure-semantic hybrid diffusion with topic-aware scoring and personalized pagerank (PPR) refinement to identify the top-k relevant documents. Experiments on four datasets show that EHRAG outperforms state-of-the-art baselines while maintaining linear indexing complexity and zero token consumption for construction. Code is available at https://github.com/yfsong00/EHRAG.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.