2601.06152v1 Jan 06, 2026 cs.AI

HiMeS: 개인화된 AI 비서를 위한 해마 모방 기억 시스템

HiMeS: Hippocampus-inspired Memory System for Personalized AI Assistants

Hailong Li
Hailong Li
Citations: 2
h-index: 1
Feifei Li
Feifei Li
Citations: 19
h-index: 2
Wenhui Que
Wenhui Que
Citations: 6
h-index: 1
Xingyu Fan
Xingyu Fan
Citations: 2
h-index: 1

대규모 언어 모델(LLM)은 챗봇, 고객 서비스 에이전트, 개인 비서와 같은 다양한 대화형 시스템의 기반이 되고 있습니다. 사용자별 개인화가 요구되는 지식 집약적 시나리오에서, 기존의 검색 증강 생성(RAG) 파이프라인은 제한된 메모리 용량과 검색 메커니즘 및 사용자별 대화 기록 간의 조율 부족으로 인해 불필요한 재확인, 관련 없는 문서 제시, 사용자 경험 저하를 초래합니다. 해마와 대뇌피질의 기억 메커니즘에서 영감을 받아, 본 논문에서는 단기 기억과 장기 기억을 융합한 AI 비서 아키텍처인 HiMeS를 제안합니다. 본 연구의 기여는 다음과 같습니다. (1) 단기 기억 추출기는 강화 학습을 통해 종단간(end-to-end)으로 훈련되어 최근 대화를 압축하고 지식 베이스에서 문서를 선제적으로 검색하며, 이는 해마와 전전두엽 피질 간의 협력적 상호작용을 모방한 것입니다. (2) 분할된 장기 기억 네트워크는 사용자별 정보를 저장하고 검색된 문서의 순위를 재조정하여, 분산된 피질 저장 및 기억 재활성화를 시뮬레이션합니다. (3) 실제 산업 데이터셋에서 HiMeS는 질의응답 품질 면에서 단계적 RAG 베이스라인보다 훨씬 뛰어난 성능을 보였습니다. (4) 소거 연구를 통해 두 기억 모듈의 필요성을 확인하였으며, 더 신뢰할 수 있고 문맥을 인식하며 사용자에게 최적화된 LLM 기반 비서로 나아가는 실용적인 방향을 제시합니다.

Original Abstract

Large language models (LLMs) power many interactive systems such as chatbots, customer-service agents, and personal assistants. In knowledge-intensive scenarios requiring user-specific personalization, conventional retrieval-augmented generation (RAG) pipelines exhibit limited memory capacity and insufficient coordination between retrieval mechanisms and user-specific conversational history, leading to redundant clarification, irrelevant documents, and degraded user experience. Inspired by the hippocampus-neocortex memory mechanism, we propose HiMeS, an AI-assistant architecture that fuses short-term and long-term memory. Our contributions are fourfold: (1) A short-term memory extractor is trained end-to-end with reinforcement learning to compress recent dialogue and proactively pre-retrieve documents from the knowledge base, emulating the cooperative interaction between the hippocampus and prefrontal cortex. (2) A partitioned long-term memory network stores user-specific information and re-ranks retrieved documents, simulating distributed cortical storage and memory reactivation. (3) On a real-world industrial dataset, HiMeS significantly outperforms a cascaded RAG baseline on question-answering quality. (4) Ablation studies confirm the necessity of both memory modules and suggest a practical path toward more reliable, context-aware, user-customized LLM-based assistants.

1 Citations
0 Influential
1 Altmetric
6.0 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!