2601.15348v1 Jan 21, 2026 cs.SD

GenAI 및 LLM을 활용한 음악 및 노래 콘텐츠의 폭력적 표현 및 가사 변환 연구

Abusive music and song transformation using GenAI and LLMs

Rohitash Chandra
Rohitash Chandra
Citations: 14
h-index: 2
Jiyang Choi
Jiyang Choi
Citations: 0
h-index: 0

음악 및 노래 콘텐츠에 반복적으로 노출되는 폭력 및 유해한 내용은 청취자의 감정과 행동에 영향을 미쳐 공격성을 정상화하거나 해로운 고정관념을 강화할 수 있습니다. 본 연구에서는 생성형 인공지능(GenAI) 및 대규모 언어 모델(LLM)을 활용하여 인기 있는 음악에서 폭력적인 단어(보컬 전달) 및 가사 내용을 자동으로 변환하는 방법을 탐구합니다. 우리는 단순히 특정 단어를 음소거하거나 대체하는 것이 아니라, 음색, 강도, 감성을 변환하여 가사뿐만 아니라 표현 방식 자체를 변화시킵니다. 본 연구에서는 선택된 영어 노래 4곡과 변환된 버전 4곡을 비교 분석하여 음향 및 감성 분석을 통해 변화를 평가합니다. 연구 결과, GenAI는 보컬의 공격성을 크게 감소시키는 것으로 나타났으며, 음향 분석 결과 Harmonic to Noise Ratio, Cepstral Peak Prominence, Shimmer가 개선되었습니다. 감성 분석 결과, 모든 아티스트에서 공격성이 63.3%에서 85.6% 감소했으며, 특히 후렴구 부분에서 최대 88.6%의 감소가 관찰되었습니다. 변환된 버전은 음악적 일관성을 유지하면서 유해한 콘텐츠를 완화하여, 기존의 콘텐츠 검열 방식이 야기할 수 있는 '금단의 열매 효과'를 피할 수 있는 유망한 대안을 제시합니다. 본 연구는 GenAI가 보다 안전한 청취 경험을 제공하면서도 예술적 표현을 보존할 수 있는 잠재력을 보여줍니다.

Original Abstract

Repeated exposure to violence and abusive content in music and song content can influence listeners' emotions and behaviours, potentially normalising aggression or reinforcing harmful stereotypes. In this study, we explore the use of generative artificial intelligence (GenAI) and Large Language Models (LLMs) to automatically transform abusive words (vocal delivery) and lyrical content in popular music. Rather than simply muting or replacing a single word, our approach transforms the tone, intensity, and sentiment, thus not altering just the lyrics, but how it is expressed. We present a comparative analysis of four selected English songs and their transformed counterparts, evaluating changes through both acoustic and sentiment-based lenses. Our findings indicate that Gen-AI significantly reduces vocal aggressiveness, with acoustic analysis showing improvements in Harmonic to Noise Ratio, Cepstral Peak Prominence, and Shimmer. Sentiment analysis reduced aggression by 63.3-85.6\% across artists, with major improvements in chorus sections (up to 88.6\% reduction). The transformed versions maintained musical coherence while mitigating harmful content, offering a promising alternative to traditional content moderation that avoids triggering the "forbidden fruit" effect, where the censored content becomes more appealing simply because it is restricted. This approach demonstrates the potential for GenAI to create safer listening experiences while preserving artistic expression.

0 Citations
0 Influential
1 Altmetric
5.0 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!