교육용 AI 에이전트의 확장 법칙
Scaling Laws for Educational AI Agents
대규모 언어 모델(LLM)에 대한 확장 법칙은 모델 파라미터, 학습 데이터, 컴퓨팅 자원 등의 측면에서 광범위하게 연구되어 왔지만, LLM 기반 교육용 에이전트의 확장성은 아직 탐구되지 않았습니다. 본 연구에서는 교육용 에이전트의 성능이 단순히 기본 모델의 크기뿐만 아니라, 역할 정의의 명확성, 기술의 깊이, 도구의 완전성, 런타임 능력, 그리고 교육 전문가의 지식 주입과 같은 구조화된 측면을 통해 확장된다고 제안합니다. 이러한 프레임워크의 핵심은 AgentProfile이라는 구조화된 JSON 기반 명세로, 교육용 에이전트의 체계적인 능력 향상을 가능하게 하는 메커니즘입니다. 본 연구에서는 이 확장 법칙을 구현하는 프로필 기반 멀티 에이전트 플랫폼인 EduClaw를 제시하며, K-12 교육 과정 전반에 걸쳐 1,100개 이상의 기술 모듈을 포함하는 330개 이상의 교육용 에이전트 프로필을 구축하고 배포하여 그 효과를 입증합니다. 우리의 실증적 관찰 결과, 교육용 에이전트의 성능은 프로필의 구조적 풍부함과 예측 가능하게 연관됩니다. 우리는 Tool Scaling(도구 확장)과 Skill Scaling(기술 확장)이라는 두 가지 상호 보완적인 확장 축을 미래 연구 방향으로 제시하며, 더욱 강력한 교육용 AI를 개발하기 위해서는 단순히 더 큰 모델을 만드는 것뿐만 아니라, 더욱 강력한 구조화된 능력 시스템을 구축하는 것이 중요하다고 주장합니다.
While scaling laws for Large Language Models (LLMs) have been extensively studied along dimensions of model parameters, training data, and compute, the scaling behavior of LLM-based educational agents remains unexplored. We propose that educational agent capability scales not merely with the underlying model size, but through structured dimensions that we collectively term the Agent Scaling Law: role definition clarity, skill depth, tool completeness, runtime capability, and educator expertise injection. Central to this framework is AgentProfile, a structured JSON-based specification that serves as the mechanism enabling systematic capability growth of educational agents. We present EduClaw, a profile-driven multi-agent platform that operationalizes this scaling law, demonstrating its effectiveness through the construction and deployment of 330+ educational agent profiles encompassing 1,100+ skill modules across K-12 subjects. Our empirical observations suggest that educational agent performance scales predictably with profile structural richness. We identify two complementary scaling axes -- Tool Scaling and Skill Scaling -- as future directions, arguing that the path to more capable educational AI lies not solely in larger models, but in stronger structured capability systems.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.