2604.24026v1 Apr 27, 2026 cs.CL

기술 텍스트에서 기술 구조로: 에이전트 기술을 위한 스케줄링-구조-논리적 표현

From Skill Text to Skill Structure: The Scheduling-Structural-Logical Representation for Agent Skills

Annika Singh
Annika Singh
Citations: 0
h-index: 0
Qiliang Liang
Qiliang Liang
Citations: 6
h-index: 1
Yang Liu
Yang Liu
Citations: 5
h-index: 1

LLM 에이전트는 점점 더 재사용 가능한 기술에 의존하는데, 이는 명령어, 제어 흐름, 제약 조건 및 도구 호출을 결합한 기능 패키지입니다. 그러나 대부분의 현재 에이전트 시스템에서 기술은 여전히 텍스트 기반의 형태로 표현되며, SKILL.md 스타일 문서나 구조화된 레코드 등이 이에 해당합니다. 이러한 레코드의 기계가 활용할 수 있는 정보는 대부분 자연어 설명에 포함되어 있습니다. 이는 기술 중심 에이전트 시스템에 어려움을 야기합니다. 기술 컬렉션을 관리하고 에이전트의 기능을 지원하기 위해서는 호출 인터페이스, 실행 구조 및 구체적인 부작용에 대한 추론이 필요하지만, 이러한 요소들이 종종 하나의 텍스트 표면에 얽혀 있습니다. 따라서 기술 지식의 명시적인 표현은 이러한 요소들이 기계에 의해 더 쉽게 습득되고 활용될 수 있도록 하는 데 도움이 될 수 있습니다. 샹크(Schank)와 앨버슨(Abelson)의 언어 지식 표현에 대한 고전적인 연구에서 영감을 받아, 우리는 에이전트 기술 아티팩트를 위한 구조화된 표현을 소개합니다. 이 표현은 기술 수준의 스케줄링 신호, 장면 수준의 실행 구조 및 논리 수준의 동작 및 리소스 사용 증거를 분리합니다. 이를 '스케줄링-구조-논리(SSL)' 표현이라고 합니다. 우리는 LLM 기반의 정규화 도구를 사용하여 SSL을 구현하고, 기술 검색 및 위험 평가라는 두 가지 작업에서 기술 데이터셋에 적용하여 평가했습니다. 그 결과, SSL은 텍스트 기반의 기존 방식보다 우수한 성능을 보였습니다. 구체적으로, 기술 검색 작업에서 SSL은 MRR을 0.573에서 0.707로 향상시켰고, 위험 평가 작업에서는 macro F1을 0.744에서 0.787로 향상시켰습니다. 이러한 결과는 명시적이고 출처 기반의 구조가 에이전트 기술을 검색하고 검토하는 것을 더 쉽게 만든다는 것을 보여줍니다. 또한 SSL은 에이전트 시스템을 위한 검토 가능하고 재사용 가능하며 운영적으로 활용 가능한 기술 표현을 향한 실질적인 단계로 이해되어야 하며, 기술을 관리하고 사용하는 완벽한 표준이나 종단 간 메커니즘은 아니라는 점을 시사합니다.

Original Abstract

LLM agents increasingly rely on reusable skills, capability packages that combine instructions, control flow, constraints, and tool calls. In most current agent systems, however, skills are still represented by text-heavy artifacts, including SKILL.md-style documents and structured records whose machine-usable evidence remains embedded largely in natural-language descriptions. This poses a challenge for skill-centered agent systems: managing skill collections and using skills to support agent both require reasoning over invocation interfaces, execution structure, and concrete side effects that are often entangled in a single textual surface. An explicit representation of skill knowledge may therefore help make these artifacts easier for machines to acquire and leverage. Drawing on Memory Organization Packets, Script Theory, and Conceptual Dependency from Schank and Abelson's classical work on linguistic knowledge representation, we introduce what is, to our knowledge, the first structured representation for agent skill artifacts that disentangles skill-level scheduling signals, scene-level execution structure, and logic-level action and resource-use evidence: the Scheduling-Structural-Logical (SSL) representation. We instantiate SSL with an LLM-based normalizer and evaluate it on a corpus of skills in two tasks, Skill Discovery and Risk Assessment, and superiorly outperform the text-only baselines: in Skill Discovery, SSL improves MRR from 0.573 to 0.707; in Risk Assessment, it improves macro F1 from 0.744 to 0.787. These findings reveal that explicit, source-grounded structure makes agent skills easier to search and review. They also suggest that SSL is best understood as a practical step toward more inspectable, reusable, and operationally actionable skill representations for agent systems, rather than as a finished standard or an end-to-end mechanism for managing and using skills.

0 Citations
0 Influential
0.5 Altmetric
2.5 Score
Original PDF

AI Analysis

Korean Summary

이 논문은 LLM 에이전트가 사용하는 '스킬(도구 호출, 제어 흐름, 명령어 등이 포함된 패키지)'을 기계가 쉽게 이해하고 활용할 수 있도록 기존의 텍스트 중심 문서(SKILL.md)를 구조화된 SSL(Scheduling-Structural-Logical) 표현으로 변환하는 프레임워크를 제안합니다. SSL은 스킬을 스케줄링(호출 인터페이스 및 목표), 구조(실행 단계 및 장면), 논리(원자적 동작 및 리소스 접근)의 3계층 JSON 그래프로 분리합니다. LLM 기반 정규화기를 통해 추출된 이 구조화된 데이터는 원본 문서와 함께 사용될 때, 수많은 스킬 중 적절한 것을 찾는 '스킬 탐색(Skill Discovery)' 작업과 실행 전 잠재적 위험을 파악하는 '위험 평가(Risk Assessment)' 작업에서 기존 텍스트 기반 방식보다 월등히 향상된 성능을 보여주어 에이전트 스킬 관리의 효율성과 안전성을 입증했습니다.

Key Innovations

  • 텍스트 형태의 에이전트 스킬 문서를 기계가 처리하기 쉬운 3계층(스케줄링, 구조, 논리) JSON 그래프인 SSL 스키마로 구조화
  • Schank와 Abelson의 고전적 언어 지식 표현 이론(MOPs, Script Theory, Conceptual Dependency)을 에이전트 스킬 모델링에 적용하여 목표, 실행 단계, 원자적 연산을 명확히 분리
  • 환각(Hallucination)을 방지하고 원본 문서에 명시된 사실에만 근거(Source-grounded)하여 데이터를 추출하는 LLM 기반 정규화(Normalization) 파이프라인 구축
  • 구조화된 증거를 통해 스킬 탐색의 검색 성능(MRR 향상)과 위험 평가의 보안 위협 요소 식별력(F1 스코어 향상)을 획기적으로 개선

Learning & Inference Impact

이 논문은 모델의 가중치를 업데이트하는 직접적인 '학습(Learning)' 알고리즘보다는, 에이전트 시스템의 '추론(Inference)' 및 의사결정 단계의 효율성과 안전성을 극대화하는 데 중점을 둡니다. 추론 측면에서 SSL 표현은 에이전트(또는 라우터)가 방대한 스킬 저장소에서 사용자 요청에 맞는 스킬을 선택할 때, 길고 노이즈가 많은 텍스트 전체를 분석할 필요 없이 명확히 분리된 인터페이스와 실행 구조 데이터를 활용하게 하여 검색 정확도와 속도를 높입니다. 또한, 모델이 스킬을 실행하기 전에 데이터 유출, 권한 남용 등의 위험 요소를 추론할 때 명시적인 리소스 접근 및 동작 데이터를 제공하여 보안 심사의 신뢰성을 높입니다. 학습 측면에서는 직접적인 기여를 명시하지 않으나, 향후 에이전트를 미세조정(Fine-tuning)할 때 이 구조화된 SSL 데이터가 고품질의 에이전트 행동 학습 코퍼스로 활용될 수 있는 잠재력을 가집니다.

Technical Difficulty

중급

Estimated implementation complexity based on methodology.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!