InfiAgent: 범용 자율 에이전트를 위한 무한 호라이즌 프레임워크
InfiAgent: An Infinite-Horizon Framework for General-Purpose Autonomous Agents
LLM 에이전트는 추론 및 도구 사용이 가능하지만, 무제한적인 컨텍스트 증가와 누적된 오류로 인해 장기(long-horizon) 과제 수행 시 종종 실패한다. 컨텍스트 압축이나 검색 증강 프롬프팅과 같은 일반적인 해결책은 정보 충실도와 추론 안정성 사이의 상충 관계(trade-off)를 발생시킨다. 본 연구에서는 지속성 상태(persistent state)를 파일 중심의 상태 추상화로 외부화하여, 작업 기간에 관계없이 에이전트의 추론 컨텍스트를 엄격하게 제한된 상태로 유지하는 범용 프레임워크인 InfiAgent를 제안한다. 각 단계에서 에이전트는 워크스페이스 상태 스냅샷과 최근 행동에 대한 고정 윈도우를 기반으로 컨텍스트를 재구성한다. DeepResearch 및 80편의 논문 문헌 검토 작업에 대한 실험 결과, 작업별 미세 조정 없이 20B 오픈 소스 모델을 탑재한 InfiAgent가 더 큰 규모의 비공개 시스템(proprietary systems)과 대등한 경쟁력을 보였으며, 컨텍스트 중심의 베이스라인보다 훨씬 높은 장기 수행 커버리지를 유지하는 것으로 나타났다. 이러한 결과는 명시적 상태 외부화가 안정적인 장기 수행 에이전트를 위한 실용적인 기반임을 뒷받침한다. Github Repo:https://github.com/ChenglinPoly/infiAgent
LLM agents can reason and use tools, but they often break down on long-horizon tasks due to unbounded context growth and accumulated errors. Common remedies such as context compression or retrieval-augmented prompting introduce trade-offs between information fidelity and reasoning stability. We present InfiAgent, a general-purpose framework that keeps the agent's reasoning context strictly bounded regardless of task duration by externalizing persistent state into a file-centric state abstraction. At each step, the agent reconstructs context from a workspace state snapshot plus a fixed window of recent actions. Experiments on DeepResearch and an 80-paper literature review task show that, without task-specific fine-tuning, InfiAgent with a 20B open-source model is competitive with larger proprietary systems and maintains substantially higher long-horizon coverage than context-centric baselines. These results support explicit state externalization as a practical foundation for stable long-horizon agents. Github Repo:https://github.com/ChenglinPoly/infiAgent
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.