BiMotion: 텍스트 유도 동적 3D 캐릭터 생성을 위한 B-스플라인 모션
BiMotion: B-spline Motion for Text-guided Dynamic 3D Character Generation
텍스트 유도 동적 3D 캐릭터 생성 기술은 빠르게 발전해 왔지만, 풍부한 텍스트 설명을 충실히 반영하는 고품질 모션을 생성하는 것은 여전히 어려운 과제이다. 기존 방법들은 고정된 길이의 시간적 입력과 풍부한 모션의 의미론을 포착하지 못하는 이산적인 프레임 단위 표현으로 인해 제한적인 하위 동작(sub-actions)이나 일관성 없는 모션을 생성하는 경향이 있다. 우리는 모션을 연속적이고 미분 가능한 B-스플라인(B-spline) 곡선으로 표현함으로써 이러한 한계를 해결하며, 이를 통해 기본 생성 모델의 기능을 수정하지 않고도 더 효과적인 모션 생성을 가능하게 한다. 구체적으로, 우리의 닫힌 형태(closed-form) 라플라시안 정규화(Laplacian-regularized) B-스플라인 솔버는 가변 길이의 모션 시퀀스를 고정된 수의 제어점(control points)을 가진 간결한 표현으로 효율적으로 압축한다. 나아가 우리는 입력 형태에 대한 밀착도를 높이기 위한 노멀 퓨전(normal-fusion) 전략과 모션 복원 품질을 위한 대응 인식(correspondence-aware) 및 국소 강성(local-rigidity) 손실을 도입한다. 모델을 훈련하기 위해, 우리는 풍부하고 고품질의 텍스트 주석이 포함된 다양하고 가변적인 길이의 3D 모션 시퀀스를 포함하는 새로운 데이터셋인 BIMO를 수집했다. 광범위한 평가 결과, 우리의 피드포워드(feed-forward) 프레임워크인 BiMotion은 기존의 최신 방법들보다 더 풍부한 표현력과 높은 품질, 그리고 프롬프트에 더 잘 부합하는 모션을 생성하며, 동시에 더 빠른 생성 속도를 달성하는 것으로 나타났다. 프로젝트 페이지는 https://wangmiaowei.github.io/BiMotion.github.io/ 이다.
Text-guided dynamic 3D character generation has advanced rapidly, yet producing high-quality motion that faithfully reflects rich textual descriptions remains challenging. Existing methods tend to generate limited sub-actions or incoherent motion due to fixed-length temporal inputs and discrete frame-wise representations that fail to capture rich motion semantics. We address these limitations by representing motion with continuous differentiable B-spline curves, enabling more effective motion generation without modifying the capabilities of the underlying generative model. Specifically, our closed-form, Laplacian-regularized B-spline solver efficiently compresses variable-length motion sequences into compact representations with a fixed number of control points. Further, we introduce a normal-fusion strategy for input shape adherence along with correspondence-aware and local-rigidity losses for motion-restoration quality. To train our model, we collate BIMO, a new dataset containing diverse variable-length 3D motion sequences with rich, high-quality text annotations. Extensive evaluations show that our feed-forward framework BiMotion generates more expressive, higher-quality, and better prompt-aligned motions than existing state-of-the-art methods, while also achieving faster generation. Our project page is at: https://wangmiaowei.github.io/BiMotion.github.io/.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.