Memento-Skills: 에이전트가 에이전트를 설계하도록 하다
Memento-Skills: Let Agents Design Agents
본 논문에서는 extit{Memento-Skills}를 소개합니다. 이는 일반적인 능력을 갖추고 지속적으로 학습 가능한 LLM 에이전트 시스템으로, extit{에이전트 설계 에이전트}로서 작동합니다. 이 시스템은 경험을 통해 특정 작업에 맞는 에이전트를 자율적으로 구축, 적응 및 개선합니다. 시스템은 extit{상태 정보를 포함하는 프롬프트}를 사용하는 메모리 기반 강화 학습 프레임워크로 구축되었으며, 재사용 가능한 기술(구조화된 마크다운 파일로 저장됨)은 지속적이고 진화하는 메모리 역할을 합니다. 이러한 기술은 행동과 맥락을 모두 인코딩하여 에이전트가 상호 작용을 통해 지식을 전달할 수 있도록 합니다. 단순한 기본 기술(예: 웹 검색 및 터미널 작업)부터 시작하여, 에이전트는 extit{Memento~2}~ ocite{wang2025memento2}에서 소개된 extit{읽기-쓰기-성찰 학습} 메커니즘을 통해 지속적으로 개선됩니다. extit{읽기} 단계에서는 행동 훈련이 가능한 기술 라우터가 현재의 상태 정보를 포함하는 프롬프트에 따라 가장 관련성이 높은 기술을 선택합니다. extit{쓰기} 단계에서는 에이전트가 새로운 경험을 기반으로 기술 라이브러리를 업데이트하고 확장합니다. 이러한 폐쇄 루프 설계는 LLM 파라미터를 업데이트하지 않고도 extit{외부화된 기술 및 프롬프트의 진화를 통해 지속적인 학습을 가능하게} 합니다. 기존의 인간이 설계한 에이전트에 의존하는 접근 방식과 달리, Memento-Skills는 일반적인 에이전트가 새로운 작업에 대해 extit{종단 간(end-to-end) 에이전트를 설계}할 수 있도록 합니다. 반복적인 기술 생성 및 개선을 통해 시스템은 자체 기능을 점진적으로 향상시킵니다. extit{General AI Assistants} 벤치마크 및 extit{Humanity's Last Exam}에 대한 실험 결과, 각각 전반적인 정확도에서 26.2% 및 116.2%의 상대적인 성능 향상을 보였습니다. 코드 및 관련 자료는 https://github.com/Memento-Teams/Memento-Skills 에서 확인할 수 있습니다.
We introduce \emph{Memento-Skills}, a generalist, continually-learnable LLM agent system that functions as an \emph{agent-designing agent}: it autonomously constructs, adapts, and improves task-specific agents through experience. The system is built on a memory-based reinforcement learning framework with \emph{stateful prompts}, where reusable skills (stored as structured markdown files) serve as persistent, evolving memory. These skills encode both behaviour and context, enabling the agent to carry forward knowledge across interactions. Starting from simple elementary skills (like Web search and terminal operations), the agent continually improves via the \emph{Read--Write Reflective Learning} mechanism introduced in \emph{Memento~2}~\cite{wang2025memento2}. In the \emph{read} phase, a behaviour-trainable skill router selects the most relevant skill conditioned on the current stateful prompt; in the \emph{write} phase, the agent updates and expands its skill library based on new experience. This closed-loop design enables \emph{continual learning without updating LLM parameters}, as all adaptation is realised through the evolution of externalised skills and prompts. Unlike prior approaches that rely on human-designed agents, Memento-Skills enables a generalist agent to \emph{design agents end-to-end} for new tasks. Through iterative skill generation and refinement, the system progressively improves its own capabilities. Experiments on the \emph{General AI Assistants} benchmark and \emph{Humanity's Last Exam} demonstrate sustained gains, achieving 26.2\% and 116.2\% relative improvements in overall accuracy, respectively. Code is available at https://github.com/Memento-Teams/Memento-Skills.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.