비정형 텍스트에 대한 집계 쿼리: 벤치마크 및 에이전트 기반 방법
Aggregation Queries over Unstructured Text: Benchmark and Agentic Method
자유 형식의 텍스트에 대한 집계 쿼리는 오랜 기간 동안 연구되어 왔지만, 아직 충분히 탐구되지 않은 문제입니다. 일반적인 질문 응답과는 달리, 집계 쿼리는 광범위한 증거 수집을 요구하며, 시스템은 단순히 '하나'를 찾는 것이 아니라 '모든 것'을 찾아야 합니다. Text-to-SQL 및 Retrieval-Augmented Generation과 같은 기존의 패러다임은 이러한 완전성을 달성하지 못합니다. 본 연구에서는, 주어진 텍스트 코퍼스 내에서 엄격한 완전성 요구 사항을 충족하는 엔티티 수준의 집계 쿼리를 공식화합니다. 체계적인 평가를 위해, 실제 대규모 코퍼스 환경에서 완전성 지향적인 집계를 평가하기 위한 벤치마크인 AGGBench를 소개합니다. 벤치마크와 함께, 집계 쿼리를 해석 가능한 단계로 분해하고, 모호성, 필터링 및 집계와 관련된 주요 실패 요소를 드러내는 모듈식 에이전트 기반의 기본 모델인 DFA (Disambiguation--Filtering--Aggregation)를 제안합니다. 실험 결과는 DFA가 강력한 RAG 및 에이전트 기반 모델보다 집계 증거의 범위를 꾸준히 향상시킨다는 것을 보여줍니다. 데이터 및 코드는 다음 링크에서 확인할 수 있습니다: [https://anonymous.4open.science/r/DFA-A4C1](https://anonymous.4open.science/r/DFA-A4C1)
Aggregation query over free text is a long-standing yet underexplored problem. Unlike ordinary question answering, aggregate queries require exhaustive evidence collection and systems are required to "find all," not merely "find one." Existing paradigms such as Text-to-SQL and Retrieval-Augmented Generation fail to achieve this completeness. In this work, we formalize entity-level aggregation querying over text in a corpus-bounded setting with strict completeness requirement. To enable principled evaluation, we introduce AGGBench, a benchmark designed to evaluate completeness-oriented aggregation under realistic large-scale corpus. To accompany the benchmark, we propose DFA (Disambiguation--Filtering--Aggregation), a modular agentic baseline that decomposes aggregation querying into interpretable stages and exposes key failure modes related to ambiguity, filtering, and aggregation. Empirical results show that DFA consistently improves aggregation evidence coverage over strong RAG and agentic baselines. The data and code are available in \href{https://anonymous.4open.science/r/DFA-A4C1}.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.