2601.19170v1 Jan 27, 2026 cs.AI

구조적 및 논리적 정제를 통한 다중 에이전트 절차적 그래프 추출

Multi-Agent Procedural Graph Extraction with Structural and Logical Refinement

Wangyang Ying

Citations: 372

h-index: 13

Yanchi Liu

Citations: 405

h-index: 12

Xujiang Zhao

Citations: 425

h-index: 11

Wei Cheng

Citations: 601

h-index: 13

Zhengzhang Chen

Citations: 19

h-index: 3

Wenchao Yu

Citations: 3,737

h-index: 27

Yanjie Fu

Citations: 257

h-index: 9

Haifeng Chen

Citations: 601

h-index: 10

자연어에서 워크플로를 절차적 그래프로 자동 추출하는 기술은 유망하지만 아직 충분히 연구되지 않은 분야로, 구조적 타당성과 논리적 정렬이 모두 요구됩니다. 최근 대규모 언어 모델(LLM)이 절차적 그래프 추출에 잠재력을 보여주고 있지만, 종종 형태가 잘못된 구조를 생성하거나 논리적 흐름을 오해하는 경우가 많습니다. 본 논문에서는 절차적 그래프 추출을 전담 구조적 및 논리적 정제 기능이 포함된 다중 라운드 추론 과정으로 정식화한 다중 에이전트 프레임워크인 \model{}을 제안합니다. 이 프레임워크는 세 단계를 반복합니다: (1) 그래프 구축 에이전트에 의한 그래프 추출 단계, (2) 시뮬레이션 에이전트가 구조적 결함을 진단하고 설명하는 구조적 피드백 단계, (3) 의미론적 에이전트가 흐름 논리와 원문의 언어적 단서 간의 의미를 일치시키는 논리적 피드백 단계입니다. 중요한 피드백은 우선순위가 지정되어 자연어로 표현되고 후속 프롬프트에 주입되어, 해석 가능하고 제어 가능한 정제를 가능하게 합니다. 이러한 모듈식 설계를 통해 에이전트는 별도의 지도 학습이나 파라미터 업데이트 없이도 서로 다른 유형의 오류를 해결할 수 있습니다. 실험 결과, \model{}은 강력한 베이스라인 모델 대비 구조적 정확성과 논리적 일관성 모두에서 상당한 성능 향상을 달성했음을 입증했습니다.

Original Abstract

Automatically extracting workflows as procedural graphs from natural language is promising yet underexplored, demanding both structural validity and logical alignment. While recent large language models (LLMs) show potential for procedural graph extraction, they often produce ill-formed structures or misinterpret logical flows. We present \model{}, a multi-agent framework that formulates procedural graph extraction as a multi-round reasoning process with dedicated structural and logical refinement. The framework iterates through three stages: (1) a graph extraction phase with the graph builder agent, (2) a structural feedback phase in which a simulation agent diagnoses and explains structural defects, and (3) a logical feedback phase in which a semantic agent aligns semantics between flow logic and linguistic cues in the source text. Important feedback is prioritized and expressed in natural language, which is injected into subsequent prompts, enabling interpretable and controllable refinement. This modular design allows agents to target distinct error types without supervision or parameter updates. Experiments demonstrate that \model{} achieves substantial improvements in both structural correctness and logical consistency over strong baselines.

0 Citations

0 Influential

13.5 Altmetric

67.5 Score

Original PDF

AI Analysis

Korean Summary

이 논문은 자연어 텍스트에서 절차적 그래프(워크플로우)를 추출할 때 발생하는 구조적 오류와 논리적 불일치 문제를 해결하기 위해 'text2flow'라는 멀티 에이전트 프레임워크를 제안합니다. 기존 LLM 기반 방법론들이 생성하는 그래프는 실행 불가능한 경로(끊어진 노드, 무한 루프 등)를 포함하거나 조건부 로직을 잘못 해석하는 경우가 많았습니다. 이를 극복하기 위해 연구진은 (1) 초기 그래프를 생성하는 빌더 에이전트, (2) 시뮬레이션을 통해 실행 흐름의 구조적 결함을 찾아내는 시뮬레이션 에이전트, (3) 원문 텍스트와 비교하여 게이트웨이(XOR, AND 등)의 논리적 정합성을 검증하는 시맨틱 에이전트로 구성된 '평가 샌드박스'를 도입했습니다. 이 시스템은 발견된 오류의 중요도를 평가하여 반복적으로 피드백을 제공함으로써, 별도의 학습 없이도 기존 모델 대비 구조적 정확성과 논리적 일관성을 크게 향상시켰습니다.

Key Innovations

구조적 결함을 탐지하기 위한 실행 추적(Execution Trace) 기반의 시뮬레이션 에이전트 도입
그래프의 논리적 흐름(게이트웨이 타입)과 원문 텍스트 간의 의미적 일치를 검증하는 시맨틱 에이전트 활용
시뮬레이션 빈도와 이전 오류 해결 여부를 기반으로 수정 제안의 우선순위를 정하는 피드백 메커니즘
단일 패스 생성이 아닌, '생성-진단-수정'의 반복적 추론(Iterative Reasoning) 과정을 통한 무감독 성능 향상

Learning & Inference Impact

이 프레임워크는 모델의 가중치를 업데이트하는 '학습(Training)' 단계보다는 '추론(Inference)' 단계의 최적화에 중점을 둡니다. 사전 학습된 LLM을 그대로 사용하면서, 멀티 에이전트 간의 상호작용과 반복적인 피드백 루프를 통해 결과물의 품질을 높이는 인컨텍스트 러닝(In-context Learning) 방식을 취합니다. 이로 인해 추론 시 토큰 사용량과 연산 비용은 증가하지만, 환각(Hallucination) 현상을 억제하고 실행 가능한 구조적 정합성을 보장합니다. 또한, SFT(지도 미세 조정) 모델보다 복잡한 추론이 필요한 작업에서 더 우수한 일반화 성능을 보여줍니다.

Technical Difficulty

중급

Estimated implementation complexity based on methodology.

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!