2601.07582v2 Jan 12, 2026 cs.CL

ES-Mem: 이벤트 분할 기반 메모리 - 장기 대화 에이전트

ES-Mem: Event Segmentation-Based Memory for Long-Term Dialogue Agents

Kaiwen Wei
Kaiwen Wei
Citations: 34
h-index: 3
Huhai Zou
Huhai Zou
Citations: 15
h-index: 3
Tianhao Sun
Tianhao Sun
Citations: 25
h-index: 3
Chuanjiang He
Chuanjiang He
Citations: 34
h-index: 3
Yu Tian
Yu Tian
Citations: 1
h-index: 1
Zhenyang Li
Zhenyang Li
Citations: 0
h-index: 0
Li Jin
Li Jin
Citations: 14
h-index: 2
Nayu Liu
Nayu Liu
Citations: 27
h-index: 3
Jiang Zhong
Jiang Zhong
Citations: 4
h-index: 1

메모리는 대화 에이전트가 일관성을 유지하고 장기적인 상호 작용에서 지속적인 적응을 가능하게 하는 데 매우 중요합니다. 기존 메모리 메커니즘은 기본적인 저장 및 검색 기능을 제공하지만, 두 가지 주요 한계점을 가지고 있습니다. (1) 경직된 메모리 세분화는 종종 의미적 일관성을 방해하여 단편적이고 일관성 없는 메모리 단위를 초래합니다. (2) 널리 사용되는 평면적인 검색 방식은 표면적인 의미 유사성에만 의존하며, 특정 에피소드적 맥락을 탐색하고 찾기 위해 필요한 담론의 구조적 단서를 무시합니다. 이러한 한계점을 극복하기 위해, 이벤트 분할 이론에서 영감을 받아, 우리는 두 가지 핵심 구성 요소를 포함하는 프레임워크인 ES-Mem을 제안합니다. (1) 동적인 이벤트 분할 모듈은 장기적인 상호 작용을 의미적으로 일관된 이벤트로 분할하며, 각 이벤트는 명확한 경계를 가집니다. (2) 계층적인 메모리 아키텍처는 다층적인 메모리를 구축하고, 경계 의미를 활용하여 특정 에피소드적 메모리를 정확한 맥락에 연결합니다. 두 가지 메모리 벤치마크에 대한 실험 결과, ES-Mem은 기존 방법보다 일관된 성능 향상을 보여주었습니다. 또한, 제안된 이벤트 분할 모듈은 대화 분할 데이터셋에 대한 강력한 적용 가능성을 보여주었습니다.

Original Abstract

Memory is critical for dialogue agents to maintain coherence and enable continuous adaptation in long-term interactions. While existing memory mechanisms offer basic storage and retrieval capabilities, they are hindered by two primary limitations: (1) rigid memory granularity often disrupts semantic integrity, resulting in fragmented and incoherent memory units; (2) prevalent flat retrieval paradigms rely solely on surface-level semantic similarity, neglecting the structural cues of discourse required to navigate and locate specific episodic contexts. To mitigate these limitations, drawing inspiration from Event Segmentation Theory, we propose ES-Mem, a framework incorporating two core components: (1) a dynamic event segmentation module that partitions long-term interactions into semantically coherent events with distinct boundaries; (2) a hierarchical memory architecture that constructs multi-layered memories and leverages boundary semantics to anchor specific episodic memory for precise context localization. Evaluations on two memory benchmarks demonstrate that ES-Mem yields consistent performance gains over baseline methods. Furthermore, the proposed event segmentation module exhibits robust applicability on dialogue segmentation datasets.

1 Citations
0 Influential
1.5 Altmetric
8.5 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!