IDRL: 개인 맞춤형 다중 모달 우울증 관련 표현 학습 프레임워크 - 우울증 진단을 위한
IDRL: An Individual-Aware Multimodal Depression-Related Representation Learning Framework for Depression Diagnosis
우울증은 심각한 정신 질환이며, 정확한 진단은 조기 개입 및 치료에 매우 중요한 역할을 합니다. 다중 모달 우울증 감지는 다양한 모달리티에서 얻은 상호 보완적인 정보를 통합하여 진단 성능을 향상시키는 것을 목표로 합니다. 최근 우울증 분석을 위한 다양한 다중 모달 학습 방법이 제안되었지만, 이러한 방법들은 다음과 같은 한계점을 가지고 있습니다. 1) 모달리티 간 불일치 및 우울증과 관련 없는 간섭 현상: 즉, 모달리티 간에 우울증 관련 징후가 상충하고, 중요한 우울증 신호를 가리는 불필요한 내용이 존재합니다. 2) 개인별 다양한 우울증 증상: 개인마다 모달리티 및 징후의 중요도가 달라져, 안정적인 통합을 어렵게 만듭니다. 이러한 문제점을 해결하기 위해, 우리는 강력한 우울증 진단을 위한 개인 맞춤형 다중 모달 우울증 관련 표현 학습 프레임워크 (IDRL)를 제안합니다. 구체적으로, IDRL은 1) 모달리티 공통 우울증 공간, 모달리티별 우울증 공간, 그리고 우울증과 관련 없는 공간으로 다중 모달 표현을 분리하여 모달리티 정렬을 강화하고 불필요한 정보를 억제하며, 2) 개별 예측 중요도에 따라 분리된 우울증 관련 특징의 가중치를 동적으로 조정하는 개인 맞춤형 모달리티 융합 모듈 (IAF)을 도입하여, 다양한 개인에 대한 적응적인 모달리티 간 융합을 가능하게 합니다. 광범위한 실험 결과는 IDRL이 다중 모달 우울증 감지에서 우수한 성능과 안정성을 달성함을 보여줍니다.
Depression is a severe mental disorder, and reliable identification plays a critical role in early intervention and treatment. Multimodal depression detection aims to improve diagnostic performance by jointly modeling complementary information from multiple modalities. Recently, numerous multimodal learning approaches have been proposed for depression analysis; however, these methods suffer from the following limitations: 1) inter-modal inconsistency and depression-unrelated interference, where depression-related cues may conflict across modalities while substantial irrelevant content obscures critical depressive signals, and 2) diverse individual depressive presentations, leading to individual differences in modality and cue importance that hinder reliable fusion. To address these issues, we propose Individual-aware Multimodal Depression-related Representation Learning Framework (IDRL) for robust depression diagnosis. Specifically, IDRL 1) disentangles multimodal representations into a modality-common depression space, a modality-specific depression space, and a depression-unrelated space to enhance modality alignment while suppressing irrelevant information, and 2) introduces an individual-aware modality-fusion module (IAF) that dynamically adjusts the weights of disentangled depression-related features based on their predictive significance, thereby achieving adaptive cross-modal fusion for different individuals. Extensive experiments demonstrate that IDRL achieves superior and robust performance for multimodal depression detection.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.