GSEM: 그래프 기반 자기 진화 메모리 - 경험 기반 임상 추론 강화
GSEM: Graph-based Self-Evolving Memory for Experience Augmented Clinical Reasoning
임상 의사 결정 시스템은 과거 의사 결정 경험을 재사용함으로써 성능 향상을 기대할 수 있습니다. 하지만, 많은 경험 기반 강화 방법들은 경험을 독립적인 기록으로 저장하며, 명시적인 관계 구조를 포함하지 않아 노이즈가 발생한 검색, 신뢰할 수 없는 재사용, 그리고 경우에 따라서는 LLM 직접 추론보다 성능이 저하될 수 있습니다. 본 논문에서는 GSEM(Graph-based Self-Evolving Memory)이라는 임상 메모리 프레임워크를 제안합니다. GSEM은 임상 경험을 이중 레이어 메모리 그래프로 구성하여, 각 경험 내의 의사 결정 구조와 경험 간의 관계 의존성을 모두 포착하고, 적용 가능성을 고려한 검색 및 온라인 피드백 기반 노드 품질 및 엣지 가중치 조정을 지원합니다. MedR-Bench 및 MedAgentsBench 데이터셋에서 DeepSeek-V3.2 및 Qwen3.5-35B 모델을 사용하여 GSEM을 실험한 결과, 모든 기준 모델 중 가장 높은 평균 정확도를 달성했습니다. 구체적으로, DeepSeek-V3.2 모델에서 70.90%, Qwen3.5-35B 모델에서 69.24%의 정확도를 보였습니다. 코드 및 관련 자료는 https://github.com/xhan1022/gsem 에서 확인할 수 있습니다.
Clinical decision-making agents can benefit from reusing prior decision experience. However, many memory-augmented methods store experiences as independent records without explicit relational structure, which may introduce noisy retrieval, unreliable reuse, and in some cases even hurt performance compared to direct LLM inference. We propose GSEM (Graph-based Self-Evolving Memory), a clinical memory framework that organizes clinical experiences into a dual-layer memory graph, capturing both the decision structure within each experience and the relational dependencies across experiences, and supporting applicability-aware retrieval and online feedback-driven calibration of node quality and edge weights. Across MedR-Bench and MedAgentsBench with two LLM backbones, GSEM achieves the highest average accuracy among all baselines, reaching 70.90\% and 69.24\% with DeepSeek-V3.2 and Qwen3.5-35B, respectively. Code is available at https://github.com/xhan1022/gsem.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.