A2RAG: 비용 효율적이고 신뢰성 있는 추론을 위한 적응형 에이전트 기반 그래프 검색
A2RAG: Adaptive Agentic Graph Retrieval for Cost-Aware and Reliable Reasoning
그래프 검색 기반 생성(Graph-RAG)은 지식 그래프로 구성된 자료를 활용하고 관계 구조를 통해 증거를 전달함으로써 멀티홉 질의 응답을 향상시킵니다. 그러나 실제 적용에서는 다음과 같은 두 가지 주요 문제가 지속적으로 발생합니다. (i) 모든 유형의 질의에 동일한 방식을 적용하기에는 적합하지 않은 다양한 난이도의 작업 부하, 즉 쉬운 질의에는 비용만 낭비하고 어려운 멀티홉 질의에는 실패할 수 있다는 점, 그리고 (ii) 추출 과정에서 세부적인 정보를 잃어버려 원본 텍스트에만 남아 있는 미묘한 표현이 누락될 수 있다는 점입니다. 본 논문에서는 비용 효율적이고 신뢰성 있는 추론을 위한 적응형 에이전트 기반 GraphRAG 프레임워크인 A2RAG를 제안합니다. A2RAG는 증거의 충분성을 검증하고 필요한 경우에만 목표적인 개선을 수행하는 적응형 제어기와, 검색 노력을 점진적으로 증가시키고 그래프 신호를 원본 텍스트로 다시 연결하여 추출 손실과 불완전한 그래프에 강건하게 대응하는 에이전트 기반 검색기로 구성됩니다. HotpotQA 및 2WikiMultiHopQA 데이터셋에 대한 실험 결과, A2RAG는 Recall@2에서 +9.9/+11.8의 절대적인 성능 향상을 달성했으며, 반복적인 멀티홉 모델에 비해 토큰 사용량과 전체 지연 시간을 약 50% 줄였습니다.
Graph Retrieval-Augmented Generation (Graph-RAG) enhances multihop question answering by organizing corpora into knowledge graphs and routing evidence through relational structure. However, practical deployments face two persistent bottlenecks: (i) mixed-difficulty workloads where one-size-fits-all retrieval either wastes cost on easy queries or fails on hard multihop cases, and (ii) extraction loss, where graph abstraction omits fine-grained qualifiers that remain only in source text. We present A2RAG, an adaptive-and-agentic GraphRAG framework for cost-aware and reliable reasoning. A2RAG couples an adaptive controller that verifies evidence sufficiency and triggers targeted refinement only when necessary, with an agentic retriever that progressively escalates retrieval effort and maps graph signals back to provenance text to remain robust under extraction loss and incomplete graphs. Experiments on HotpotQA and 2WikiMultiHopQA demonstrate that A2RAG achieves +9.9/+11.8 absolute gains in Recall@2, while cutting token consumption and end-to-end latency by about 50% relative to iterative multihop baselines.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.