헤라클레스: 정밀 추적과 생성적 합성의 융합을 통한 범용 인간형 로봇 제어
Heracles: Bridging Precise Tracking and Generative Synthesis for General Humanoid Control
범용 인간형 로봇 제어를 달성하기 위해서는 명령된 동작의 정밀한 실행과 예측 불가능한 환경 변화에 대한 유연하고 인간적인 적응력 사이의 섬세한 균형이 필요합니다. 현재의 범용 제어기는 주로 동작 제어를 경직된 참조 추적 문제로 정의합니다. 이러한 추적기는 정상적인 조건에서는 효과적이지만, 심각한 외부 충격 하에서는 경직되고 인간적인 움직임을 닮지 않은 오류를 보이는 경향이 있으며, 이는 인간의 운동 제어에 내재된 생성적 적응력이 부족하기 때문입니다. 이러한 한계를 극복하기 위해, 우리는 정밀한 동작 추적과 생성적 합성을 융합하는 새로운 상태 기반 확산 중간웨어를 제안합니다. 헤라클레스는 경직된 추적 방식이나 복잡한 명시적 모드 전환에 의존하지 않고, 고수준 참조 동작과 저수준 물리 추적기 사이의 중간 계층으로 작동합니다. 로봇의 실시간 상태에 따라 확산 모델은 암묵적으로 동작을 조정합니다. 상태가 참조와 일치할 때는 항등 함수에 가까워져서 초기 상태에서의 추적 성능을 유지하고, 반대로 상당한 상태 변화가 발생하면 자연스럽고 인간적인 회복 경로를 생성하는 생성적 합성기로 원활하게 전환합니다. 우리의 프레임워크는 생성적 사전 지식을 제어 루프에 통합함으로써 극한의 외부 충격에 대한 견고성을 크게 향상시킬 뿐만 아니라, 인간형 로봇 제어를 경직된 추적 방식에서 벗어나 개방적이고 생성적인 범용 아키텍처로 발전시킬 수 있음을 보여줍니다.
Achieving general-purpose humanoid control requires a delicate balance between the precise execution of commanded motions and the flexible, anthropomorphic adaptability needed to recover from unpredictable environmental perturbations. Current general controllers predominantly formulate motion control as a rigid reference-tracking problem. While effective in nominal conditions, these trackers often exhibit brittle, non-anthropomorphic failure modes under severe disturbances, lacking the generative adaptability inherent to human motor control. To overcome this limitation, we propose Heracles, a novel state-conditioned diffusion middleware that bridges precise motion tracking and generative synthesis. Rather than relying on rigid tracking paradigms or complex explicit mode-switching, Heracles operates as an intermediary layer between high-level reference motions and low-level physics trackers. By conditioning on the robot's real-time state, the diffusion model implicitly adapts its behavior: it approximates an identity map when the state closely aligns with the reference, preserving zero-shot tracking fidelity. Conversely, when encountering significant state deviations, it seamlessly transitions into a generative synthesizer to produce natural, anthropomorphic recovery trajectories. Our framework demonstrates that integrating generative priors into the control loop not only significantly enhances robustness against extreme perturbations but also elevates humanoid control from a rigid tracking paradigm to an open-ended, generative general-purpose architecture.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.