ViviDoc: 인간-에이전트 협력을 통한 대화형 문서 생성
ViviDoc: Generating Interactive Documents through Human-Agent Collaboration
대화형 문서는 동적 시각화, 인터랙티브 애니메이션 및 탐색적 인터페이스를 통해 독자들이 복잡한 아이디어와 더욱 깊이 있게 상호 작용할 수 있도록 돕습니다. 그러나 이러한 문서를 만드는 것은 여전히 비용이 많이 들며, 전문 지식과 웹 개발 기술 모두가 필요합니다. 최근의 대규모 언어 모델(LLM) 기반 에이전트는 콘텐츠 생성을 자동화할 수 있지만, 이를 대화형 문서 생성에 직접 적용하는 경우 제어하기 어려운 결과물이 종종 생성됩니다. 이러한 문제를 해결하기 위해, 저희는 지금까지 알려진 바와 달리 대화형 문서 생성에 대한 체계적인 접근 방식을 제시하는 ViviDoc을 소개합니다. ViviDoc은 계획기(Planner), 스타일러(Styler), 실행기(Executor), 평가기(Evaluator)로 구성된 다중 에이전트 파이프라인을 도입합니다. 생성 프로세스를 제어 가능하게 하기 위해, 저희는 세 가지 수준의 인간 제어를 제공합니다: (1) 구조화된 계획을 위한 SRTC 상호 작용 사양(상태, 렌더링, 전환, 제약 조건)을 포함하는 문서 사양(DocSpec), (2) 작성 및 상호 작용 스타일을 사용자 정의할 수 있는 콘텐츠 인식 스타일 팔레트, (3) 반복적인 개선을 위한 채팅 기반 편집. 또한, 저희는 11개 분야의 실제 대화형 문서에서 파생된 101개 주제로 구성된 벤치마크인 ViviBench를 구축했습니다. 여기에는 8가지 상호 작용 유형의 분류와 인간 평가에 의해 검증된 4차원 자동 평가 프레임워크가 포함되어 있습니다(Pearson 상관 계수 > 0.84). 실험 결과, ViviDoc은 자동 평가 및 인간 평가 모두에서 가장 풍부한 콘텐츠와 상호 작용 품질을 달성했습니다. 12명의 사용자를 대상으로 한 연구 결과, 이 시스템은 사용하기 쉽고, 생성 프로세스에 대한 효과적인 제어를 제공하며, 사용자의 요구를 충족하는 문서를 생성한다는 것을 확인했습니다.
Interactive documents help readers engage with complex ideas through dynamic visualization, interactive animations, and exploratory interfaces. However, creating such documents remains costly, as it requires both domain expertise and web development skills. Recent Large Language Model (LLM)-based agents can automate content creation, but directly applying them to interactive document generation often produces outputs that are difficult to control. To address this, we present ViviDoc, to the best of our knowledge the first work to systematically address interactive document generation. ViviDoc introduces a multi-agent pipeline (Planner, Styler, Executor, Evaluator). To make the generation process controllable, we provide three levels of human control: (1) the Document Specification (DocSpec) with SRTC Interaction Specifications (State, Render, Transition, Constraint) for structured planning, (2) a content-aware Style Palette for customizing writing and interaction styles, and (3) chat-based editing for iterative refinement. We also construct ViviBench, a benchmark of 101 topics derived from real-world interactive documents across 11 domains, along with a taxonomy of 8 interaction types and a 4-dimensional automated evaluation framework validated against human ratings (Pearson r > 0.84). Experiments show that ViviDoc achieves the highest content richness and interaction quality in both automated and human evaluation. A 12-person user study confirms that the system is easy to use, provides effective control over the generation process, and produces documents that satisfy users.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.