DailyArt: 잠재적 동역학을 활용한 단일 정지 이미지로부터의 관절 추정
DailyArt: Discovering Articulation from Single Static Images via Latent Dynamics
관절 구조를 갖는 물체는 자율 시스템 및 세계 모델에 필수적이지만, 단일 정지 이미지로부터 이들의 운동학적 정보를 추론하는 것은 중요한 운동 정보가 종종 가려져 있기 때문에 어려운 문제입니다. 기존 방법들은 다중 상태 관측 데이터를 필요로 하거나, 명시적인 부품 정보, 검색, 또는 다른 보조 입력에 의존하여 추론해야 할 구조를 부분적으로 노출시킵니다. 본 연구에서는 DailyArt를 제안합니다. DailyArt는 관절 구조 추정 문제를 합성 기반 추론 문제로 정의합니다. DailyArt는 가려진 이미지로부터 직접적으로 관절을 예측하는 대신, 동일한 카메라 시야 하에서 최대한 관절이 펼쳐진 상태를 먼저 합성하여 관절 정보를 드러낸 다음, 관측된 상태와 합성된 상태 간의 차이를 이용하여 전체 관절 파라미터를 추정합니다. DailyArt는 집합 예측 방식을 사용하여, 객체별 템플릿, 다중 뷰 입력, 또는 명시적인 부품 어노테이션 없이 테스트 시점에 모든 관절을 동시에 복원합니다. 제안된 프레임워크는 추정된 관절을 조건으로 사용하여, 관절에 기반한 부품 수준의 새로운 상태 합성을 지원합니다. 광범위한 실험 결과, DailyArt는 관절 구조 추정에서 뛰어난 성능을 보이며, 관절에 기반한 부품 수준의 새로운 상태 합성을 지원하는 것을 확인했습니다. 프로젝트 페이지는 https://rangooo123.github.io/DaliyArt.github.io/ 에서 확인할 수 있습니다.
Articulated objects are essential for embodied AI and world models, yet inferring their kinematics from a single closed-state image remains challenging because crucial motion cues are often occluded. Existing methods either require multi-state observations or rely on explicit part priors, retrieval, or other auxiliary inputs that partially expose the structure to be inferred. In this work, we present DailyArt, which formulates articulated joint estimation from a single static image as a synthesis-mediated reasoning problem. Instead of directly regressing joints from a heavily occluded observation, DailyArt first synthesizes a maximally articulated opened state under the same camera view to expose articulation cues, and then estimates the full set of joint parameters from the discrepancy between the observed and synthesized states. Using a set-prediction formulation, DailyArt recovers all joints simultaneously without requiring object-specific templates, multi-view inputs, or explicit part annotations at test time. Taking estimated joints as conditions, the framework further supports part-level novel state synthesis as a downstream capability. Extensive experiments show that DailyArt achieves strong performance in articulated joint estimation and supports part-level novel state synthesis conditioned on joints. Project page is available at https://rangooo123.github.io/DaliyArt.github.io/.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.