2602.02536v1 Jan 28, 2026 cs.LG

희소한 결정에서 밀집된 추론으로: 다중 모드 검열을 위한 다중 속성 기반 경로 패러다임

From Sparse Decisions to Dense Reasoning: A Multi-attribute Trajectory Paradigm for Multimodal Moderation

Yan Teng
Yan Teng
Citations: 313
h-index: 9
Yujiu Yang
Yujiu Yang
Citations: 62
h-index: 4
Tianle Gu
Tianle Gu
Citations: 107
h-index: 5
Kexin Huang
Kexin Huang
Citations: 11
h-index: 2
Lingyu Li
Lingyu Li
Citations: 41
h-index: 4
Ruilin Luo
Ruilin Luo
Citations: 258
h-index: 7
Shi-hua Huang
Shi-hua Huang
Citations: 24
h-index: 3
Zongqi Wang
Zongqi Wang
Citations: 39
h-index: 3
Yingchun Wang
Yingchun Wang
Citations: 271
h-index: 8

안전 검열은 유해 콘텐츠를 식별하는 데 매우 중요합니다. 텍스트 기반 안전 검열은 성공적이었지만, 다중 모드 기반 검열은 데이터와 지도 학습 데이터의 부족이라는 이중적인 어려움에 직면해 있습니다. 기존의 이진 레이블에 대한 의존은 단축 학습을 초래하며, 이는 효과적인 다중 모드 구분을 위해 필요한 고유한 분류 경계를 흐립니다. 따라서, 우리는 희소한 의사 결정에서 밀집된 추론 과정으로 전환하는 새로운 학습 패러다임 (UniMod)을 제안합니다. UniMod는 증거 기반, 모드 평가, 위험 매핑, 정책 결정 및 응답 생성 단계를 포함하는 구조화된 경로를 구축하여, 단일화된 의사 결정 작업을 다차원 경계 학습 프로세스로 재구성합니다. 이 접근 방식은 모델이 명시적인 안전 의미론에 기반하여 의사 결정을 내리도록 강제하여, 모델이 표면적인 단축 경로에 수렴하는 것을 방지합니다. 이 패러다임을 지원하기 위해, 다중 헤드 스칼라 보상 모델 (UniRM)을 개발했습니다. UniRM은 응답 생성 단계에 속성 수준의 점수를 할당하여 다차원적인 감독을 제공합니다. 또한, 작업별 파라미터를 분리하고 학습 동역을 재조정하는 특수 최적화 전략을 도입하여, 다중 작업 학습에서 다양한 목표 간의 간섭을 효과적으로 해결합니다. 실험 결과는 UniMod가 우수한 텍스트 검열 성능을 달성했으며, 기존 모델보다 40% 미만의 학습 데이터를 사용하여 새로운 다중 모드 성능 기준을 설정했음을 보여줍니다. 추가적인 분석을 통해 다중 속성 기반 경로 추론의 효과를 검증했으며, 이는 다중 모드 검열을 위한 효과적이고 효율적인 프레임워크를 제공합니다. 추가 자료는 프로젝트 웹사이트에서 확인할 수 있습니다: [https://trustworthylab.github.io/UniMod/](https://trustworthylab.github.io/UniMod/)

Original Abstract

Safety moderation is pivotal for identifying harmful content. Despite the success of textual safety moderation, its multimodal counterparts remain hindered by a dual sparsity of data and supervision. Conventional reliance on binary labels lead to shortcut learning, which obscures the intrinsic classification boundaries necessary for effective multimodal discrimination. Hence, we propose a novel learning paradigm (UniMod) that transitions from sparse decision-making to dense reasoning traces. By constructing structured trajectories encompassing evidence grounding, modality assessment, risk mapping, policy decision, and response generation, we reformulate monolithic decision tasks into a multi-dimensional boundary learning process. This approach forces the model to ground its decision in explicit safety semantics, preventing the model from converging on superficial shortcuts. To facilitate this paradigm, we develop a multi-head scalar reward model (UniRM). UniRM provides multi-dimensional supervision by assigning attribute-level scores to the response generation stage. Furthermore, we introduce specialized optimization strategies to decouple task-specific parameters and rebalance training dynamics, effectively resolving interference between diverse objectives in multi-task learning. Empirical results show UniMod achieves competitive textual moderation performance and sets a new multimodal benchmark using less than 40\% of the training data used by leading baselines. Ablations further validate our multi-attribute trajectory reasoning, offering an effective and efficient framework for multimodal moderation. Supplementary materials are available at \href{https://trustworthylab.github.io/UniMod/}{project website}.

1 Citations
0 Influential
4.5 Altmetric
23.5 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!