상태 그래프: 대규모 언어 모델을 이용한 추론 작업 해결
Graph of States: Solving Abductive Tasks with Large Language Models
논리적 추론은 연역, 귀납, 그리고 추론을 포함합니다. 그러나 대규모 언어 모델(LLM)은 전자에 대해서는 효과적으로 능력을 갖추었지만, 추론은 여전히 상대적으로 연구가 부족합니다. 기존의 프레임워크는 주로 정적인 연역 작업에 설계되었으며, 구조화되지 않은 상태 표현과 명시적인 상태 제어의 부족으로 인해 추론으로 일반화하는 데 실패합니다. 그 결과, 필연적으로 증거 위조, 문맥 변화, 추론 실패, 그리고 조기 종료와 같은 문제를 야기합니다. 이러한 격차를 해소하기 위해, 추론 작업에 특화된 범용 신경-기호 프레임워크인 상태 그래프(Graph of States, GoS)를 소개합니다. GoS는 구조화된 믿음 상태를 기반으로 다중 에이전트 협업을 지원하며, 인과 그래프를 사용하여 논리적 의존성을 명시적으로 인코딩하고, 상태 머신을 사용하여 추론 과정의 유효한 전환을 관리합니다. 이러한 기호 제약 조건과 추론 초점을 동적으로 일치시킴으로써, 저희의 접근 방식은 무방향적이고 제약 없는 탐색을 수렴적이고 지향적인 검색으로 전환합니다. 두 개의 실제 데이터셋에 대한 광범위한 평가 결과, GoS는 모든 기준 모델보다 훨씬 뛰어난 성능을 보이며, 복잡한 추론 작업에 대한 강력한 솔루션을 제공합니다. 코드 저장소 및 모든 프롬프트: https://anonymous.4open.science/r/Graph-of-States-5B4E.
Logical reasoning encompasses deduction, induction, and abduction. However, while Large Language Models (LLMs) have effectively mastered the former two, abductive reasoning remains significantly underexplored. Existing frameworks, predominantly designed for static deductive tasks, fail to generalize to abductive reasoning due to unstructured state representation and lack of explicit state control. Consequently, they are inevitably prone to Evidence Fabrication, Context Drift, Failed Backtracking, and Early Stopping. To bridge this gap, we introduce Graph of States (GoS), a general-purpose neuro-symbolic framework tailored for abductive tasks. GoS grounds multi-agent collaboration in a structured belief states, utilizing a causal graph to explicitly encode logical dependencies and a state machine to govern the valid transitions of the reasoning process. By dynamically aligning the reasoning focus with these symbolic constraints, our approach transforms aimless, unconstrained exploration into a convergent, directed search. Extensive evaluations on two real-world datasets demonstrate that GoS significantly outperforms all baselines, providing a robust solution for complex abductive tasks. Code repo and all prompts: https://anonymous.4open.science/r/Graph-of-States-5B4E.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.