BrandFusion: 텍스트-비디오 생성에서 원활한 브랜드 통합을 위한 다중 에이전트 프레임워크
BrandFusion: A Multi-Agent Framework for Seamless Brand Integration in Text-to-Video Generation
텍스트-비디오(T2V) 모델의 빠른 발전은 콘텐츠 제작에 혁신을 가져왔지만, 상업적 잠재력은 아직 충분히 활용되지 못하고 있습니다. 본 연구에서는 T2V 기술에 있어, 광고주 브랜드를 자동으로 비디오에 통합하면서 사용자의 의도에 대한 의미적 일관성을 유지하는 '원활한 브랜드 통합'이라는 새로운 과제를 제시합니다. 이 과제는 프롬프트 충실도 유지, 브랜드 인지도 확보, 그리고 문맥적으로 자연스러운 통합이라는 세 가지 핵심적인 문제를 안고 있습니다. 이러한 문제들을 해결하기 위해, 우리는 두 가지 상호 보완적인 단계로 구성된 새로운 다중 에이전트 프레임워크인 BrandFusion을 제안합니다. 오프라인 단계(광고주 대상)에서는 모델의 사전 지식을 활용하고 경량 미세 조정을 통해 새로운 브랜드를 적응시켜 브랜드 지식 기반을 구축합니다. 온라인 단계(사용자 대상)에서는 다섯 개의 에이전트가 공유된 지식 기반과 실시간 문맥 추적을 활용하여 사용자의 프롬프트를 반복적으로 개선하고, 이를 통해 브랜드 가시성과 의미적 일관성을 보장합니다. 18개의 기존 브랜드와 2개의 자체 브랜드에 대한 다양한 최첨단 T2V 모델을 사용한 실험 결과, BrandFusion은 의미 보존, 브랜드 인지도, 통합의 자연스러움 측면에서 기존 방식보다 훨씬 뛰어난 성능을 보였습니다. 인간 평가 결과 또한 사용자 만족도가 더 높다는 것을 확인했으며, 이는 지속 가능한 T2V 수익 창출을 위한 실질적인 방법을 제시합니다.
The rapid advancement of text-to-video (T2V) models has revolutionized content creation, yet their commercial potential remains largely untapped. We introduce, for the first time, the task of seamless brand integration in T2V: automatically embedding advertiser brands into prompt-generated videos while preserving semantic fidelity to user intent. This task confronts three core challenges: maintaining prompt fidelity, ensuring brand recognizability, and achieving contextually natural integration. To address them, we propose BrandFusion, a novel multi-agent framework comprising two synergistic phases. In the offline phase (advertiser-facing), we construct a Brand Knowledge Base by probing model priors and adapting to novel brands via lightweight fine-tuning. In the online phase (user-facing), five agents jointly refine user prompts through iterative refinement, leveraging the shared knowledge base and real-time contextual tracking to ensure brand visibility and semantic alignment. Experiments on 18 established and 2 custom brands across multiple state-of-the-art T2V models demonstrate that BrandFusion significantly outperforms baselines in semantic preservation, brand recognizability, and integration naturalness. Human evaluations further confirm higher user satisfaction, establishing a practical pathway for sustainable T2V monetization.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.