SwiftMem: 쿼리 기반 인덱싱을 통한 빠른 에이전트 메모리
SwiftMem: Fast Agentic Memory via Query-aware Indexing
에이전트 메모리 시스템은 LLM 에이전트가 장기적인 컨텍스트를 유지하고 관련 정보를 효율적으로 검색하도록 하는 데 중요한 역할을 합니다. 그러나 기존 메모리 프레임워크는 쿼리 특성을 고려하지 않고 전체 저장 공간에 대해 광범위한 검색을 수행한다는 근본적인 한계를 가지고 있습니다. 이러한 무차별적인 접근 방식은 메모리 용량이 증가함에 따라 심각한 지연 문제를 야기하며, 실시간 에이전트 상호 작용을 방해합니다. 본 논문에서는 쿼리 기반 에이전트 메모리 시스템인 SwiftMem을 제안합니다. SwiftMem은 시간 및 의미 차원을 기반으로 하는 특수 인덱싱을 통해 선형 이하의 검색 성능을 달성합니다. 시간 인덱스를 통해 시간 제약이 있는 검색을 위한 로그 시간 범위 쿼리가 가능하며, 의미 기반 DAG-Tag 인덱스는 계층적 태그 구조를 통해 쿼리를 관련 주제에 매핑합니다. 또한, 메모리 확장에 따른 단편화를 해결하기 위해, 저장 공간을 의미 기반 클러스터에 따라 재구성하여 캐시 지역성을 향상시키는 임베딩-태그 공동 통합 메커니즘을 도입했습니다. LoCoMo 및 LongMemEval 벤치마크 실험 결과, SwiftMem은 최첨단 기준 모델보다 47배 빠른 검색 속도를 달성하면서도 경쟁력 있는 정확도를 유지하여, 메모리 확장이 적용된 LLM 에이전트의 실용적인 배포를 가능하게 합니다.
Agentic memory systems have become critical for enabling LLM agents to maintain long-term context and retrieve relevant information efficiently. However, existing memory frameworks suffer from a fundamental limitation: they perform exhaustive retrieval across the entire storage layer regardless of query characteristics. This brute-force approach creates severe latency bottlenecks as memory grows, hindering real-time agent interactions. We propose SwiftMem, a query-aware agentic memory system that achieves sub-linear retrieval through specialized indexing over temporal and semantic dimensions. Our temporal index enables logarithmic-time range queries for time-sensitive retrieval, while the semantic DAG-Tag index maps queries to relevant topics through hierarchical tag structures. To address memory fragmentation during growth, we introduce an embedding-tag co-consolidation mechanism that reorganizes storage based on semantic clusters to improve cache locality. Experiments on LoCoMo and LongMemEval benchmarks demonstrate that SwiftMem achieves 47$\times$ faster search compared to state-of-the-art baselines while maintaining competitive accuracy, enabling practical deployment of memory-augmented LLM agents.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.