검색하지 않고 탐색하세요: 기업 지식을 탐색 가능한 에이전트 기술로 변환하여 QA 및 RAG 시스템 성능 향상
Don't Retrieve, Navigate: Distilling Enterprise Knowledge into Navigable Agent Skills for QA and RAG
검색 증강 생성(RAG)은 LLM의 응답을 외부 증거에 기반하도록 하지만, 모델을 검색 결과의 수동적인 소비자로 취급합니다. 모델은 데이터베이스의 구조나 아직 검색되지 않은 정보에 대해 알 수 없기 때문에, 모델이 이전 단계로 돌아가거나 분산된 증거를 결합하는 능력이 제한됩니다. 본 논문에서는 Corpus2Skill이라는 방법을 제안합니다. 이 방법은 문서 데이터베이스를 오프라인에서 계층 구조의 기술 디렉토리로 변환하고, LLM 에이전트가 실시간으로 이를 탐색하도록 합니다. 이 컴파일 파이프라인은 문서를 반복적으로 클러스터링하고, 각 수준에서 LLM이 작성한 요약을 생성하며, 결과를 탐색 가능한 기술 파일의 트리 형태로 구체화합니다. 실시간 운영 시, 에이전트는 데이터베이스 전체에 대한 개략적인 정보를 받고, 점진적으로 세분화된 요약을 통해 특정 주제 영역으로 깊이 들어가며, ID를 사용하여 전체 문서를 검색합니다. 계층 구조가 명시적으로 표시되어 있기 때문에, 에이전트는 어디를 찾아야 할지 추론하고, 비생산적인 경로에서 벗어나며, 여러 영역에 걸쳐 증거를 결합할 수 있습니다. 기업 고객 지원 벤치마크인 WixQA에서, Corpus2Skill은 밀집 검색, RAPTOR 및 에이전트 기반 RAG 모델을 포함한 기존 방법들을 모든 품질 지표에서 능가하는 성능을 보였습니다.
Retrieval-Augmented Generation (RAG) grounds LLM responses in external evidence but treats the model as a passive consumer of search results: it never sees how the corpus is organized or what it has not yet retrieved, limiting its ability to backtrack or combine scattered evidence. We present Corpus2Skill, which distills a document corpus into a hierarchical skill directory offline and lets an LLM agent navigate it at serve time. The compilation pipeline iteratively clusters documents, generates LLM-written summaries at each level, and materializes the result as a tree of navigable skill files. At serve time, the agent receives a bird's-eye view of the corpus, drills into topic branches via progressively finer summaries, and retrieves full documents by ID. Because the hierarchy is explicitly visible, the agent can reason about where to look, backtrack from unproductive paths, and combine evidence across branches. On WixQA, an enterprise customer-support benchmark for RAG, Corpus2Skill outperforms dense retrieval, RAPTOR, and agentic RAG baselines across all quality metrics.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.