MEDNA-DFM: 설명 가능한 DNA 메틸화 예측을 위한 이중 뷰 FiLM-MoE 모델
MEDNA-DFM: A Dual-View FiLM-MoE Model for Explainable DNA Methylation Prediction
정확한 DNA 메틸화 계산적 식별은 후성 유전적 조절을 이해하는 데 필수적입니다. 딥러닝은 이 이진 분류 작업에서 뛰어난 성능을 보이지만, 그 '블랙박스' 특성은 생물학적 통찰력을 방해합니다. 우리는 고성능 모델 MEDNA-DFM과 함께, 메커니즘에 영감을 받은 신호 정제 알고리즘을 도입하여 이 문제를 해결합니다. 우리의 연구 결과는 MEDNA-DFM이 보존된 메틸화 패턴을 효과적으로 포착하며, 다양한 종에 걸쳐 강력한 구분을 달성한다는 것을 보여줍니다. 외부 독립 데이터 세트에 대한 검증 결과, 모델의 일반화 성능은 계통 발생적 근접성이 아닌, 보존된 고유 모티프(예: GC 함량)에 의해 결정된다는 것을 확인했습니다. 또한, 개발된 알고리즘을 적용하여 추출된 모티프는 기존 연구보다 훨씬 높은 신뢰도를 가집니다. 마지막으로, Drosophila 6mA 사례 연구에서 얻은 경험적 증거를 바탕으로, '시퀀스-구조 시너지' 가설을 제시합니다. 이 가설은 GAGG 코어 모티프와 상류 A-트랙 요소가 함께 작동한다고 제안합니다. 우리는 또한 in silico 돌연변이 유발 실험을 통해 이 가설을 검증했으며, 이 두 요소 중 하나 또는 둘 다를 제거하면 모델의 인식 능력이 크게 저하된다는 것을 확인했습니다. 이 연구는 메틸화 예측을 위한 강력한 도구를 제공하며, 설명 가능한 딥러닝이 방법론적 혁신과 생물학적 가설 생성에 어떻게 기여할 수 있는지 보여줍니다.
Accurate computational identification of DNA methylation is essential for understanding epigenetic regulation. Although deep learning excels in this binary classification task, its "black-box" nature impedes biological insight. We address this by introducing a high-performance model MEDNA-DFM, alongside mechanism-inspired signal purification algorithms. Our investigation demonstrates that MEDNA-DFM effectively captures conserved methylation patterns, achieving robust distinction across diverse species. Validation on external independent datasets confirms that the model's generalization is driven by conserved intrinsic motifs (e.g., GC content) rather than phylogenetic proximity. Furthermore, applying our developed algorithms extracted motifs with significantly higher reliability than prior studies. Finally, empirical evidence from a Drosophila 6mA case study prompted us to propose a "sequence-structure synergy" hypothesis, suggesting that the GAGG core motif and an upstream A-tract element function cooperatively. We further validated this hypothesis via in silico mutagenesis, confirming that the ablation of either or both elements significantly degrades the model's recognition capabilities. This work provides a powerful tool for methylation prediction and demonstrates how explainable deep learning can drive both methodological innovation and the generation of biological hypotheses.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.