FlowMind: LLM 추론을 통한 구조화된 워크플로우 생성을 위한 Execute-Summarize(실행 후 요약) 기법
FlowMind: Execute-Summarize for Structured Workflow Generation from LLM Reasoning
LLM은 추론과 도구 사용을 통해 복잡한 과제를 해결할 수 있지만, 이러한 해결 과정을 구조화된 워크플로우로 정확하게 변환하는 것은 여전히 어려운 문제입니다. 우리는 워크플로우를 도구 사용의 연속으로 모델링하고, 이 문제를 과제 해결과 신뢰성 있는 워크플로우 구성을 모두 수행할 수 있는 메커니즘을 설계하는 것으로 재정의했습니다. 실행 중에 워크플로우를 구축하는 기존의 접근 방식들은 두 과정 간의 간섭으로 인해 종종 부정확성을 겪습니다. 이에 우리는 과제 실행과 워크플로우 구성을 분리하는 Execute-Summarize(ES) 프레임워크를 제안합니다. 이 프레임워크에서 모델은 먼저 사용 가능한 도구를 이용해 과제를 완료한 후, 실행 추적(trace)을 바탕으로 구조화된 워크플로우를 독립적으로 재구성합니다. 이러한 분리는 워크플로우의 정확성과 견고성을 향상시킵니다. 우리는 FlowBench를 소개하고 광범위한 실험을 통해 우리의 접근 방식이 기존 방법들을 능가함을 보여주며, 자유 형식의 LLM 추론을 구조화된 워크플로우로 구체화(grounding)하기 위한 신뢰할 수 있는 패러다임을 제공합니다.
LLMs can solve complex tasks through reasoning and tool use, but accurately translating these solutions into structured workflows remains challenging. We model workflows as sequences of tool use and reformulate the problem as designing a mechanism that can both solve tasks and reliably construct workflows. Prior approaches that build workflows during execution often suffer from inaccuracies due to interference between the two processes. We propose an Execute-Summarize(ES) framework that decouples task execution from workflow construction: the model first completes the task using available tools, then independently reconstructs a structured workflow from execution traces. This separation improves workflow accuracy and robustness. We introduce FlowBench and show through extensive experiments that our approach outperforms existing methods, providing a reliable paradigm for grounding free-form LLM reasoning into structured workflows.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.