자연어 기반 에이전트 하니스
Natural-Language Agent Harnesses
에이전트의 성능은 점점 더 extit{하니스 설계}에 의존하지만, 하니스 설계는 일반적으로 컨트롤러 코드와 런타임 관련 규칙에 숨겨져 있어, 이식, 비교 및 과학적 연구를 어렵게 만듭니다. 본 연구에서는 에이전트 하니스의 고수준 제어 로직을 이식 가능한 실행 파일 형태로 외부화할 수 있는지 질문합니다. 우리는 extbf{자연어 기반 에이전트 하니스 (Natural-Language Agent Harnesses, NLAH)}를 제안하며, 이는 편집 가능한 자연어로 하니스의 동작을 표현합니다. 또한 extbf{지능형 하니스 런타임 (Intelligent Harness Runtime, IHR)}을 제안합니다. 이는 명시적인 계약, 지속 가능한 아티팩트, 그리고 경량 어댑터를 통해 이러한 하니스를 실행하는 공유 런타임입니다. 우리는 코딩 및 컴퓨터 사용 벤치마크를 통해 운영 가능성, 모듈 제거, 코드-텍스트 하니스 변환 등의 측면에서 체계적인 평가를 수행했습니다.
Agent performance increasingly depends on \emph{harness engineering}, yet harness design is usually buried in controller code and runtime-specific conventions, making it hard to transfer, compare, and study as a scientific object. We ask whether the high-level control logic of an agent harness can instead be externalized as a portable executable artifact. We introduce \textbf{Natural-Language Agent Harnesses} (NLAHs), which express harness behavior in editable natural language, and \textbf{Intelligent Harness Runtime} (IHR), a shared runtime that executes these harnesses through explicit contracts, durable artifacts, and lightweight adapters. Across coding and computer-use benchmarks, we conduct controlled evaluations of operational viability, module ablation, and code-to-text harness migration.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.