검색할 것인가, 사고할 것인가? 맥락 진화를 위한 주체적 접근 방식
To Retrieve or To Think? An Agentic Approach for Context Evolution
검색 증강 생성(Retrieval-Augmented Generation)과 같은 현재의 맥락 확장 방법은 지식 집약적인 추론 작업을 해결하는 데 필수적입니다. 그러나 이러한 방법들은 일반적으로 경직되고 무차별적인 전략을 따르며, 매 단계마다 검색을 수행합니다. 이러한 무분별한 접근 방식은 불필요한 계산 비용을 초래할 뿐만 아니라, 관련 없는 노이즈로 맥락을 채워 성능을 저하시킵니다. 이러한 한계점을 해결하기 위해, 우리는 인간의 메타인지에서 영감을 받은 프레임워크인 Agentic Context Evolution (ACE)을 소개합니다. ACE는 새로운 증거를 찾을 것인지, 아니면 기존 지식을 활용하여 추론할 것인지를 동적으로 결정합니다. ACE는 중앙 오케스트레이터 에이전트를 사용하여 다수결 방식을 통해 전략적으로 결정을 내립니다. ACE는 외부 검색을 수행하는 검색 에이전트와 내부 분석 및 정제를 수행하는 추론 에이전트 사이를 번갈아 가며 활성화하는 것을 목표로 합니다. ACE는 불필요한 검색 단계를 제거하여 간결하고 진화된 맥락을 유지합니다. 어려운 멀티홉 질의응답 벤치마크에 대한 광범위한 실험 결과, ACE는 정확도 측면에서 경쟁적인 기본 모델보다 훨씬 뛰어난 성능을 보이며, 효율적인 토큰 사용량을 달성했습니다. 본 연구는 복잡하고 지식 집약적인 작업에 대한 맥락 진화 생성 기술을 발전시키는 데 귀중한 통찰력을 제공합니다.
Current context augmentation methods, such as retrieval-augmented generation, are essential for solving knowledge-intensive reasoning tasks. However, they typically adhere to a rigid, brute-force strategy that executes retrieval at every step. This indiscriminate approach not only incurs unnecessary computational costs but also degrades performance by saturating the context with irrelevant noise. To address these limitations, we introduce Agentic Context Evolution (ACE), a framework inspired by human metacognition that dynamically determines whether to seek new evidence or reason with existing knowledge. ACE employs a central orchestrator agent to make decisions strategically via majority voting. It aims to alternate between activating a retriever agent for external retrieval and a reasoner agent for internal analysis and refinement. By eliminating redundant retrieval steps, ACE maintains a concise and evolved context. Extensive experiments on challenging multi-hop QA benchmarks demonstrate that ACE significantly outperforms competitive baselines in accuracy while achieving efficient token consumption. Our work provides valuable insights into advancing context-evolved generation for complex, knowledge-intensive tasks.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.