2603.04356v1 Mar 04, 2026 cs.RO

RoboCasa365: 범용 로봇 훈련 및 성능 평가를 위한 대규모 시뮬레이션 프레임워크

RoboCasa365: A Large-Scale Simulation Framework for Training and Benchmarking Generalist Robots

Soroush Nasiriany
Soroush Nasiriany
Citations: 4,892
h-index: 17
Sepehr Nasiriany
Sepehr Nasiriany
Citations: 6
h-index: 1
Abhiram Maddukuri
Abhiram Maddukuri
Citations: 1,296
h-index: 6
Yuke Zhu
Yuke Zhu
Citations: 128
h-index: 6

최근 로봇 학습 분야의 발전은 인간 환경에서 일상적인 작업을 수행할 수 있는 범용 로봇 개발에 상당한 진전을 가져왔습니다. 그러나 이러한 비전이 얼마나 가까워졌는지 파악하기는 여전히 어렵습니다. 이 분야는 체계적인 평가를 위한 재현 가능한 대규모 벤치마크가 부족합니다. 이러한 격차를 해소하기 위해, 우리는 가정용 로봇의 이동 및 조작 작업을 위한 포괄적인 시뮬레이션 벤치마크인 RoboCasa365를 소개합니다. RoboCasa 플랫폼을 기반으로 구축된 RoboCasa365는 2,500개의 다양한 주방 환경에서 365가지의 일상적인 작업을 포함하며, 600시간 이상의 인간 시연 데이터와 1,600시간 이상의 합성 시연 데이터를 제공합니다. 이는 범용 정책 연구를 위한 가장 다양하고 대규모의 리소스 중 하나입니다. RoboCasa365는 다중 작업 학습, 로봇 기반 모델 훈련, 지속적인 학습 등 다양한 문제 설정을 위한 체계적인 평가를 지원하도록 설계되었습니다. 우리는 최첨단 방법을 사용하여 이 벤치마크에 대한 광범위한 실험을 수행하고, 작업 다양성, 데이터 세트 규모 및 환경 변화가 일반화에 미치는 영향을 분석했습니다. 우리의 결과는 범용 로봇의 성능에 가장 큰 영향을 미치는 요인에 대한 새로운 통찰력을 제공하며, 이 분야의 미래 발전을 위한 전략을 제시합니다.

Original Abstract

Recent advances in robot learning have accelerated progress toward generalist robots that can perform everyday tasks in human environments. Yet it remains difficult to gauge how close we are to this vision. The field lacks a reproducible, large-scale benchmark for systematic evaluation. To fill this gap, we present RoboCasa365, a comprehensive simulation benchmark for household mobile manipulation. Built on the RoboCasa platform, RoboCasa365 introduces 365 everyday tasks across 2,500 diverse kitchen environments, with over 600 hours of human demonstration data and over 1600 hours of synthetically generated demonstration data -- making it one of the most diverse and large-scale resources for studying generalist policies. RoboCasa365 is designed to support systematic evaluations for different problem settings, including multi-task learning, robot foundation model training, and lifelong learning. We conduct extensive experiments on this benchmark with state-of-the-art methods and analyze the impacts of task diversity, dataset scale, and environment variation on generalization. Our results provide new insights into what factors most strongly affect the performance of generalist robots and inform strategies for future progress in the field.

6 Citations
0 Influential
8.5 Altmetric
48.5 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!