FileGram: 파일 시스템 동작 기록을 활용한 에이전트 개인화
FileGram: Grounding Agent Personalization in File-System Behavioral Traces
로컬 파일 시스템 내에서 작동하는 협업 AI 에이전트는 인간-AI 상호작용의 새로운 패러다임으로 빠르게 부상하고 있습니다. 그러나 엄격한 개인 정보 보호 장벽과 다양한 실시간 데이터 수집의 어려움으로 인해 효과적인 개인화는 심각한 데이터 제약으로 인해 제한됩니다. 또한 기존 방법들은 상호작용에 집중하는 반면, 파일 시스템 작업에서 발생하는 풍부한 동작 기록을 간과합니다. 이러한 격차를 해소하기 위해, 우리는 에이전트의 기억과 개인화를 파일 시스템 동작 기록에 기반하도록 하는 포괄적인 프레임워크인 FileGram을 제안합니다. FileGram은 세 가지 핵심 구성 요소로 구성됩니다. (1) FileGramEngine: 실제 워크플로우를 시뮬레이션하고 대규모로 세분화된 다중 모드 동작 시퀀스를 생성하는 확장 가능한 개인화 데이터 엔진입니다. (2) FileGramBench: 파일 시스템 동작 기록에 기반한 진단 벤치마크로, 프로필 재구성, 동작 분리, 개인화 변화 감지 및 다중 모드 연결과 같은 측면에서 메모리 시스템을 평가합니다. (3) FileGramOS: 대화 요약 대신 원자적인 동작과 콘텐츠 변경 사항으로부터 직접 사용자 프로필을 구축하는 하향식 메모리 아키텍처로, 이러한 동작 기록을 절차적, 의미적, 에피소드적 채널로 인코딩하고 쿼리 시간에 추상화합니다. 광범위한 실험 결과, FileGramBench는 최첨단 메모리 시스템에게 여전히 어려운 과제이며, FileGramEngine과 FileGramOS는 효과적임을 보여줍니다. 또한, 이 프레임워크를 공개함으로써, 개인화된 메모리 중심 파일 시스템 에이전트에 대한 향후 연구를 지원하고자 합니다.
Coworking AI agents operating within local file systems are rapidly emerging as a paradigm in human-AI interaction; however, effective personalization remains limited by severe data constraints, as strict privacy barriers and the difficulty of jointly collecting multimodal real-world traces prevent scalable training and evaluation, and existing methods remain interaction-centric while overlooking dense behavioral traces in file-system operations; to address this gap, we propose FileGram, a comprehensive framework that grounds agent memory and personalization in file-system behavioral traces, comprising three core components: (1) FileGramEngine, a scalable persona-driven data engine that simulates realistic workflows and generates fine-grained multimodal action sequences at scale; (2) FileGramBench, a diagnostic benchmark grounded in file-system behavioral traces for evaluating memory systems on profile reconstruction, trace disentanglement, persona drift detection, and multimodal grounding; and (3) FileGramOS, a bottom-up memory architecture that builds user profiles directly from atomic actions and content deltas rather than dialogue summaries, encoding these traces into procedural, semantic, and episodic channels with query-time abstraction; extensive experiments show that FileGramBench remains challenging for state-of-the-art memory systems and that FileGramEngine and FileGramOS are effective, and by open-sourcing the framework, we hope to support future research on personalized memory-centric file-system agents.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.