2605.14237v1 May 14, 2026 cs.AI

안정적인 실행: 99%의 성공률과 99%의 토큰 사용량 감소를 달성하는 LOOP 스킬 엔진 - 원샷 레코딩 및 결정적 리플레이를 통한 구현

Good to Go: The LOOP Skill Engine That Hits 99% Success and Slashes Token Usage by 99% via One-Shot Recording and Deterministic Replay

Kai Yu
Kai Yu
Citations: 35
h-index: 2
Xiaohua Wang
Xiaohua Wang
Citations: 2
h-index: 1
Xuxia Liang
Xuxia Liang
Citations: 20
h-index: 3
Liang Wang
Liang Wang
Citations: 42
h-index: 1
Chao Han
Chao Han
Citations: 16
h-index: 2

반복적인 정기 작업에 AI 에이전트를 배포하는 것은 중요한 딜레마를 야기합니다. 대규모 언어 모델(LLM)은 도구 오케스트레이션 측면에서 뛰어난 유연성을 제공하지만, 내재적인 확률성으로 인해 예측 불가능한 오류가 발생하며, 반복적인 호출은 엄청난 토큰 비용을 초래합니다. 본 논문에서는 LOOP SKILL ENGINE이라는 시스템을 소개합니다. 이 시스템은 원샷 레코딩 및 결정적 리플레이 패러다임을 통해 정기 에이전트 작업에 대해 99%의 성공률과 99%의 토큰 사용량 감소를 동시에 달성합니다. 에이전트가 처음 실행될 때, 전체 LLM 추론을 수행하면서 시스템은 도구 호출 경로를 투명하게 가로채어 기록합니다. 탐욕적인 길이 내림차순 템플릿 추출 알고리즘은 이 기록을 매개변수화되고 분기 없는 루프 스킬로 변환합니다. 루프 스킬은 작업의 기능적 의도를 포착하면서 시간 의존적 및 결과 의존적 변수를 매개변수화한 결정적 실행 계획입니다. 이후 모든 실행은 LLM을 완전히 우회합니다. 엔진은 템플릿 변수를 실시간 값에 매핑하고 도구 시퀀스를 결정적으로 재생합니다. 우리는 다음 두 가지 정리를 증명합니다. (1) 리플레이 결정성: 검증된 루프 스킬의 단계 시퀀스는 모든 후속 실행에서 불변입니다. (2) 쓰기 안전성: 지속적인 구성에 대한 동시 접근은 재진입 잠금 및 원자 파일 교체를 통해 직렬화됩니다. 5분에서 24시간까지의 간격을 갖는 다양한 정기 에이전트 작업에 대한 벤치마크 테스트에서, 루프 스킬 엔진은 월간 토큰 소비를 93.3%~99.98%까지 줄이고 실행 지연 시간을 8.7배 단축하며, 출력의 비결정성을 제거합니다. 다층 감쇠 전략은 작업이 중단되지 않도록 보장합니다. 우리는 이 엔진을 buddyMe 오픈 소스 에이전트 프레임워크의 일부로 공개합니다.

Original Abstract

Deploying AI agents for repetitive periodic tasks exposes a critical tension: Large Language Models (LLMs) offer unmatched flexibility in tool orchestration, yet their inherent stochasticity causes unpredictable failures, and repeated invocations incur prohibitive token costs. We present the LOOP SKILL ENGINE, a system that achieves a combined 99% success rate and 99% token reduction for periodic agent tasks through a one-shot recording, deterministic replay paradigm. On its first run, the agent executes the task with full LLM reasoning while the system transparently intercepts and records the complete tool-call trajectory. A greedy length-descending template extraction algorithm then converts this recording into a parameterized, branch-free Loop Skill -- a deterministic execution plan that captures the task's functional intent while parameterizing time-dependent and result-dependent variables. All subsequent executions bypass the LLM entirely: the engine resolves template variables against real-time values and replays the tool sequence deterministically. We prove two theorems: (1) Replay Determinism -- the step sequence of a validated Loop Skill is invariant across all future executions; (2) Write Safety -- concurrent access to persistent configuration is serialized through reentrant locks and atomic file replacement. Across a benchmark of periodic agent tasks spanning intervals from 5 minutes to 24 hours, the Loop Skill Engine reduces monthly token consumption by 93.3%--99.98% and cuts execution latency by 8.7x while eliminating output non-determinism. A multi-layer degradation strategy guarantees that tasks never stall. We release the engine as part of the buddyMe open-source agent framework.

0 Citations
0 Influential
1.5 Altmetric
7.5 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!