DUPLEX: LLM 기반 정보 추출을 통한 에이전트 기반 이중 시스템 계획
DUPLEX: Agentic Dual-System Planning via LLM-Driven Information Extraction
대규모 언어 모델(LLM)은 로봇 작업 계획에 의미적 유연성을 제공하지만, 환각 및 논리적 불일치에 취약하여 장기적인 환경에서의 신뢰성을 제한합니다. 본 연구에서는 비정형 환경과 엄격한 계획 수립 사이의 격차를 해소하기 위해, LLM을 스키마 기반 정보 추출에만 엄격하게 제한하는 에이전트 기반 이중 시스템 신경-기호 아키텍처인 DUPLEX를 제안합니다. 제안하는 프레임워크에서, 순방향 Fast System은 경량 LLM을 사용하여 자연어에서 개체, 관계 등을 추출하고, 이를 결정적으로 고전적인 기호 계획기를 위한 계획 도메인 정의 언어(PDDL) 문제 파일로 매핑합니다. 복잡하거나 불명확한 시나리오를 해결하기 위해, 계획 실패 시에만 Slow System이 활성화되어, 솔버 진단을 활용하여 고용량 LLM이 반복적인 성찰 및 수정을 수행합니다. 12개의 고전적인 계획 도메인 및 가정 환경에서의 광범위한 실험 결과는 DUPLEX가 기존의 엔드-투-엔드 및 하이브리드 LLM 모델을 성공률 및 신뢰성 측면에서 크게 능가함을 보여줍니다. 이러한 결과는 LLM을 단순히 더 잘 계획하도록 만드는 것이 아니라, LLM이 잘하는 부분인 구조화된 의미 기반 표현에 집중시키고, 논리적인 계획 수립은 기호 계획기에 맡기는 것이 중요하다는 것을 확인합니다.
While Large Language Models (LLMs) provide semantic flexibility for robotic task planning, their susceptibility to hallucination and logical inconsistency limits their reliability in long-horizon domains. To bridge the gap between unstructured environments and rigorous plan synthesis, we propose DUPLEX, an agentic dual-system neuro-symbolic architecture that strictly confines the LLM to schema-guided information extraction rather than end-to-end planning or code generation. In our framework, a feed-forward Fast System utilizes a lightweight LLM to extract entities, relations etc. from natural language, deterministically mapping them into a Planning Domain Definition Language (PDDL) problem file for a classical symbolic planner. To resolve complex or underspecified scenarios, a Slow System is activated exclusively upon planning failure, leveraging solver diagnostics to drive a high-capacity LLM in iterative reflection and repair. Extensive evaluations across 12 classical and household planning domains demonstrate that DUPLEX significantly outperforms existing end-to-end and hybrid LLM baselines in both success rate and reliability. These results confirm that The key is not to make the LLM plan better, but to restrict the LLM to the part it is good at - structured semantic grounding - and leave logical plan synthesis to a symbolic planner.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.