Scale-Plan: 확장 가능한 언어 기반 작업 계획 시스템 - 이질적인 다중 로봇 팀을 위한 설계
Scale-Plan: Scalable Language-Enabled Task Planning for Heterogeneous Multi-Robot Teams
다양한 로봇 시스템에서 협업 작업을 수행하기 위해서는 장기적인 작업 계획이 필수적이지만, 이는 방대한 양의 시각 정보 때문에 어려운 과제입니다. 대부분의 시각 정보는 작업 목표와 관련이 없으며, 계획 과정에 부담을 줍니다. 기존의 기호 기반 계획 시스템은 수동으로 구성된 문제 사양에 의존하기 때문에 확장성과 적응성이 제한됩니다. 반면, 최근의 대규모 언어 모델(LLM) 기반 접근 방식은 객체가 많은 환경에서 환각 현상과 취약한 지향성(생성된 계획과 실제 환경 객체 및 제약 조건 간의 불일치) 문제를 겪는 경우가 많습니다. 본 논문에서는 Scale-Plan이라는 확장 가능한 LLM 기반 프레임워크를 제안합니다. Scale-Plan은 자연어 지침으로부터 간결하고 작업 관련 문제 표현을 생성합니다. PDDL 도메인 사양이 주어지면, Scale-Plan은 도메인 구조를 포착하는 액션 그래프를 구축하고, 얕은 LLM 추론을 사용하여 구조화된 그래프 탐색을 안내하여 관련 액션 및 객체의 최소 부분 집합을 식별합니다. Scale-Plan은 계획 전에 관련 없는 정보를 필터링하여 효율적인 분해, 할당 및 장기적인 계획 생성을 가능하게 합니다. 우리는 복잡한 다중 에이전트 작업에 대한 Scale-Plan의 성능을 평가하고, 다중 로봇 계획 시스템의 신뢰성 있는 평가를 위한 AI2-THOR을 기반으로 구축된 MAT2-THOR이라는 새로운 벤치마크를 소개합니다. Scale-Plan은 모든 지표에서 순수한 LLM 및 하이브리드 LLM-PDDL 기준 모델보다 우수한 성능을 보이며, 확장성과 신뢰성을 향상시킵니다.
Long-horizon task planning for heterogeneous multi-robot systems is essential for deploying collaborative teams in real-world environments; yet, it remains challenging due to the large volume of perceptual information, much of which is irrelevant to task objectives and burdens planning. Traditional symbolic planners rely on manually constructed problem specifications, limiting scalability and adaptability, while recent large language model (LLM)-based approaches often suffer from hallucinations and weak grounding-i.e., poor alignment between generated plans and actual environmental objects and constraints-in object-rich settings. We present Scale-Plan, a scalable LLM-assisted framework that generates compact, task-relevant problem representations from natural language instructions. Given a PDDL domain specification, Scale-Plan constructs an action graph capturing domain structure and uses shallow LLM reasoning to guide a structured graph search that identifies a minimal subset of relevant actions and objects. By filtering irrelevant information prior to planning, Scale-Plan enables efficient decomposition, allocation, and long-horizon plan generation. We evaluate our approach on complex multi-agent tasks and introduce MAT2-THOR, a cleaned benchmark built on AI2-THOR for reliable evaluation of multi-robot planning systems. Scale-Plan outperforms pure LLM and hybrid LLM-PDDL baselines across all metrics, improving scalability and reliability.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.