2604.03333v1 Apr 03, 2026 cs.SD

컴포저 벡터: 잠재 공간에서의 스타일 제어를 통한 심볼릭 음악 생성

Composer Vector: Style-steering Symbolic Music Generation in a Latent Space

Julian J. McAuley
Julian J. McAuley
Citations: 26
h-index: 1
Xunyi Jiang
Xunyi Jiang
Citations: 10
h-index: 2
Mingyang Yao
Mingyang Yao
Citations: 4
h-index: 1
Jingyue Huang
Jingyue Huang
Citations: 2
h-index: 1

심볼릭 음악 생성 분야는 상당한 발전을 이루었지만, 작곡가의 스타일을 정교하고 유연하게 제어하는 것은 여전히 어려운 과제입니다. 기존의 작곡가 스타일을 조건으로 하는 훈련 기반 방법은 대규모의 레이블링된 데이터셋에 의존합니다. 또한, 이러한 방법들은 일반적으로 한 번에 하나의 작곡가 스타일만 지원하여, 보다 창의적이거나 혼합된 시나리오에 적용하기 어렵습니다. 본 연구에서는 재훈련 없이 모델의 잠재 공간에서 직접 작곡가 스타일을 제어하는 추론 시점 제어 방법인 '컴포저 벡터(Composer Vector)'를 제안합니다. 여러 심볼릭 음악 생성 모델에 대한 실험을 통해, 컴포저 벡터가 목표 작곡가 스타일에 맞춰 음악 생성을 효과적으로 유도하며, 연속적인 제어 계수를 통해 부드럽고 해석 가능한 제어를 가능하게 함을 보여줍니다. 또한, 단일 잠재 공간 프레임워크 내에서 여러 스타일을 원활하게 융합할 수 있습니다. 전반적으로, 본 연구는 간단한 잠재 공간 제어가 제어 가능한 심볼릭 음악 생성을 위한 실용적이고 일반적인 메커니즘을 제공하며, 보다 유연하고 상호작용적인 창작 워크플로우를 가능하게 함을 보여줍니다. 코드 및 데모는 다음 링크에서 확인할 수 있습니다: https://github.com/JiangXunyi/Composer-Vector 및 https://jiangxunyi.github.io/composervector.github.io/

Original Abstract

Symbolic music generation has made significant progress, yet achieving fine-grained and flexible control over composer style remains challenging. Existing training-based methods for composer style conditioning depend on large labeled datasets. Besides, these methods typically support only single-composer generation at a time, limiting their applicability to more creative or blended scenarios. In this work, we propose Composer Vector, an inference-time steering method that operates directly in the model's latent space to control composer style without retraining. Through experiments on multiple symbolic music generation models, we show that Composer Vector effectively guides generations toward target composer styles, enabling smooth and interpretable control through a continuous steering coefficient. It also enables seamless fusion of multiple styles within a unified latent space framework. Overall, our work demonstrates that simple latent space steering provides a practical and general mechanism for controllable symbolic music generation, enabling more flexible and interactive creative workflows. Code and Demo are available here: https://github.com/JiangXunyi/Composer-Vector and https://jiangxunyi.github.io/composervector.github.io/

1 Citations
0 Influential
24.4657359028 Altmetric
123.3 Score
Original PDF
1

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!