2603.09481v1 Mar 10, 2026 cs.AI

GenePlan: 대규모 언어 모델을 활용하여 더 나은 일반화된 PDDL 계획을 생성하는 진화 계획 시스템

GenePlan: Evolving Better Generalized PDDL Plans using Large Language Models

Alberto Pozanco
Alberto Pozanco
Citations: 190
h-index: 8
Andrew Murray
Andrew Murray
Citations: 4
h-index: 1
Danial Dervovic
Danial Dervovic
Citations: 353
h-index: 6
Michael Cashmore
Michael Cashmore
Citations: 4
h-index: 1

본 논문에서는 GenePlan (GENeralized Evolutionary Planner)이라는 새로운 프레임워크를 제시합니다. GenePlan은 대규모 언어 모델(LLM)을 활용한 진화 알고리즘을 사용하여 PDDL로 설명되는 고전적인 계획 문제에 대한 도메인 의존적인 일반화된 계획 시스템을 생성합니다. GenePlan은 일반화된 계획 문제를 최적화 문제로 간주하고, 다양한 문제 인스턴스에서 계획 길이를 최소화하는 해석 가능한 Python 기반 계획 시스템을 반복적으로 진화시킵니다. 6개의 기존 벤치마크 도메인과 2개의 새로운 도메인에 대한 실험 결과, GenePlan은 평균 SAT 점수가 0.91로, 최첨단 계획 시스템(SAT 점수 0.93)과 거의 동일한 성능을 보였으며, 체인 오브 씽크(CoT) 프롬프팅과 같은 다른 LLM 기반 기준 모델(평균 SAT 점수 0.64)보다 훨씬 뛰어난 성능을 보였습니다. 생성된 계획 시스템은 새로운 인스턴스를 매우 빠르게 해결합니다(작업당 평균 0.49초) 또한 비용이 저렴합니다(GPT-4o를 사용하여 도메인당 평균 1.82달러).

Original Abstract

We present GenePlan (GENeralized Evolutionary Planner), a novel framework that leverages large language model (LLM) assisted evolutionary algorithms to generate domain-dependent generalized planners for classical planning tasks described in PDDL. By casting generalized planning as an optimization problem, GenePlan iteratively evolves interpretable Python planners that minimize plan length across diverse problem instances. In empirical evaluation across six existing benchmark domains and two new domains, GenePlan achieved an average SAT score of 0.91, closely matching the performance of the state-of-the-art planners (SAT score 0.93), and significantly outperforming other LLM-based baselines such as chain-of-thought (CoT) prompting (average SAT score 0.64). The generated planners solve new instances rapidly (average 0.49 seconds per task) and at low cost (average $1.82 per domain using GPT-4o).

1 Citations
0 Influential
4 Altmetric
21.0 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!