2603.27012v1 Mar 27, 2026 cs.RO

UMI-Underwater: 수중 로봇 조작을 위한 수중 원격 조작 없이 학습하는 방법

UMI-Underwater: Learning Underwater Manipulation without Underwater Teleoperation

Hao Li
Hao Li
Citations: 326
h-index: 7
Long Yin Chung
Long Yin Chung
Citations: 3
h-index: 1
John Goler
John Goler
Citations: 5
h-index: 1
R. Zhang
R. Zhang
Citations: 9
h-index: 1
Xiaochi Xie
Xiaochi Xie
Citations: 1
h-index: 1
Huy Ha
Huy Ha
Citations: 1,220
h-index: 6
Shuran Song
Shuran Song
Citations: 13
h-index: 1
Mark R. Cutkosky
Mark R. Cutkosky
Citations: 93
h-index: 4

수중 로봇의 물체 잡기는 이미지 품질 저하, 높은 변동성, 그리고 다양한 수중 시연 데이터 수집의 어려움으로 인해 어렵습니다. 본 연구에서는 (i) 자체적으로 구축된 데이터 수집 파이프라인을 통해 성공적인 수중 잡기 시연 데이터를 자동으로 수집하고, (ii) 육상에서 수집된 인간 시연 데이터를 활용하여 수중 환경과의 격차를 해소하고 조명 및 색상 변화에 강건한 깊이 기반 어포던스(affordance) 표현을 통해 잡기 지식을 전달하는 시스템을 제안합니다. 육상에서 수집된 휴대용 시연 데이터를 기반으로 학습된 어포던스 모델을 기하학적 정렬을 통해 수중 환경에 적용하고, 수중 시연 데이터를 이용하여 어포던스에 조건화된 확산 정책을 학습시켜 제어 명령을 생성합니다. 수영장 환경에서의 실험 결과, 제안하는 방법은 잡기 성능과 배경 변화에 대한 강건성을 향상시키고, 육상 데이터에서만 관찰된 객체에 대한 일반화 능력을 제공하며, RGB 이미지만 사용하는 기존 방법보다 우수한 성능을 보였습니다. 코드, 동영상, 추가 결과는 https://umi-under-water.github.io 에서 확인할 수 있습니다.

Original Abstract

Underwater robotic grasping is difficult due to degraded, highly variable imagery and the expense of collecting diverse underwater demonstrations. We introduce a system that (i) autonomously collects successful underwater grasp demonstrations via a self-supervised data collection pipeline and (ii) transfers grasp knowledge from on-land human demonstrations through a depth-based affordance representation that bridges the on-land-to-underwater domain gap and is robust to lighting and color shift. An affordance model trained on on-land handheld demonstrations is deployed underwater zero-shot via geometric alignment, and an affordance-conditioned diffusion policy is then trained on underwater demonstrations to generate control actions. In pool experiments, our approach improves grasping performance and robustness to background shifts, and enables generalization to objects seen only in on-land data, outperforming RGB-only baselines. Code, videos, and additional results are available at https://umi-under-water.github.io.

1 Citations
0 Influential
3.5 Altmetric
18.5 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!