구조적 및 논리적 정제를 통한 다중 에이전트 절차적 그래프 추출
Multi-Agent Procedural Graph Extraction with Structural and Logical Refinement
자연어에서 워크플로를 절차적 그래프로 자동 추출하는 기술은 유망하지만 아직 충분히 연구되지 않은 분야로, 구조적 타당성과 논리적 정렬이 모두 요구됩니다. 최근 대규모 언어 모델(LLM)이 절차적 그래프 추출에 잠재력을 보여주고 있지만, 종종 형태가 잘못된 구조를 생성하거나 논리적 흐름을 오해하는 경우가 많습니다. 본 논문에서는 절차적 그래프 추출을 전담 구조적 및 논리적 정제 기능이 포함된 다중 라운드 추론 과정으로 정식화한 다중 에이전트 프레임워크인 \model{}을 제안합니다. 이 프레임워크는 세 단계를 반복합니다: (1) 그래프 구축 에이전트에 의한 그래프 추출 단계, (2) 시뮬레이션 에이전트가 구조적 결함을 진단하고 설명하는 구조적 피드백 단계, (3) 의미론적 에이전트가 흐름 논리와 원문의 언어적 단서 간의 의미를 일치시키는 논리적 피드백 단계입니다. 중요한 피드백은 우선순위가 지정되어 자연어로 표현되고 후속 프롬프트에 주입되어, 해석 가능하고 제어 가능한 정제를 가능하게 합니다. 이러한 모듈식 설계를 통해 에이전트는 별도의 지도 학습이나 파라미터 업데이트 없이도 서로 다른 유형의 오류를 해결할 수 있습니다. 실험 결과, \model{}은 강력한 베이스라인 모델 대비 구조적 정확성과 논리적 일관성 모두에서 상당한 성능 향상을 달성했음을 입증했습니다.
Automatically extracting workflows as procedural graphs from natural language is promising yet underexplored, demanding both structural validity and logical alignment. While recent large language models (LLMs) show potential for procedural graph extraction, they often produce ill-formed structures or misinterpret logical flows. We present \model{}, a multi-agent framework that formulates procedural graph extraction as a multi-round reasoning process with dedicated structural and logical refinement. The framework iterates through three stages: (1) a graph extraction phase with the graph builder agent, (2) a structural feedback phase in which a simulation agent diagnoses and explains structural defects, and (3) a logical feedback phase in which a semantic agent aligns semantics between flow logic and linguistic cues in the source text. Important feedback is prioritized and expressed in natural language, which is injected into subsequent prompts, enabling interpretable and controllable refinement. This modular design allows agents to target distinct error types without supervision or parameter updates. Experiments demonstrate that \model{} achieves substantial improvements in both structural correctness and logical consistency over strong baselines.
AI Analysis
Korean Summary
Key Innovations
- 구조적 결함을 탐지하기 위한 실행 추적(Execution Trace) 기반의 시뮬레이션 에이전트 도입
- 그래프의 논리적 흐름(게이트웨이 타입)과 원문 텍스트 간의 의미적 일치를 검증하는 시맨틱 에이전트 활용
- 시뮬레이션 빈도와 이전 오류 해결 여부를 기반으로 수정 제안의 우선순위를 정하는 피드백 메커니즘
- 단일 패스 생성이 아닌, '생성-진단-수정'의 반복적 추론(Iterative Reasoning) 과정을 통한 무감독 성능 향상
Learning & Inference Impact
이 프레임워크는 모델의 가중치를 업데이트하는 '학습(Training)' 단계보다는 '추론(Inference)' 단계의 최적화에 중점을 둡니다. 사전 학습된 LLM을 그대로 사용하면서, 멀티 에이전트 간의 상호작용과 반복적인 피드백 루프를 통해 결과물의 품질을 높이는 인컨텍스트 러닝(In-context Learning) 방식을 취합니다. 이로 인해 추론 시 토큰 사용량과 연산 비용은 증가하지만, 환각(Hallucination) 현상을 억제하고 실행 가능한 구조적 정합성을 보장합니다. 또한, SFT(지도 미세 조정) 모델보다 복잡한 추론이 필요한 작업에서 더 우수한 일반화 성능을 보여줍니다.
Technical Difficulty
Estimated implementation complexity based on methodology.