2602.22850v1 Feb 26, 2026 cs.LG

MEDNA-DFM: 설명 가능한 DNA 메틸화 예측을 위한 이중 뷰 FiLM-MoE 모델

MEDNA-DFM: A Dual-View FiLM-MoE Model for Explainable DNA Methylation Prediction

Jixiu Zhai
Jixiu Zhai
Citations: 2
h-index: 1
J. Kong
J. Kong
Citations: 121
h-index: 5
Tianchi Lu Cuiying Honors College
Tianchi Lu Cuiying Honors College
Citations: 0
h-index: 0
Lanzhou University
Lanzhou University
Citations: 265
h-index: 6
Lanzhou
Lanzhou
Citations: 478
h-index: 12
Gansu
Gansu
Citations: 11
h-index: 3
China
China
Citations: 2
h-index: 1
School of Management
School of Management
Citations: 108
h-index: 3
Shanghai Innovation Institute
Shanghai Innovation Institute
Citations: 0
h-index: 0
Shanghai
Shanghai
Citations: 287
h-index: 2
S. O. Mathematics
S. O. Mathematics
Citations: 2,468
h-index: 28
Statistics
Statistics
Citations: 131
h-index: 3
D. Science
D. Science
Citations: 885
h-index: 13
City University of Hong Kong
City University of Hong Kong
Citations: 202
h-index: 5
Kowloon
Kowloon
Citations: 32
h-index: 3
Hong Kong
Hong Kong
Citations: 7
h-index: 2
Yi He
Yi He
Citations: 11
h-index: 1
Yin Cao
Yin Cao
Citations: 47
h-index: 2
Di Wang
Di Wang
Citations: 1
h-index: 1

정확한 DNA 메틸화 계산적 식별은 후성 유전적 조절을 이해하는 데 필수적입니다. 딥러닝은 이 이진 분류 작업에서 뛰어난 성능을 보이지만, 그 '블랙박스' 특성은 생물학적 통찰력을 방해합니다. 우리는 고성능 모델 MEDNA-DFM과 함께, 메커니즘에 영감을 받은 신호 정제 알고리즘을 도입하여 이 문제를 해결합니다. 우리의 연구 결과는 MEDNA-DFM이 보존된 메틸화 패턴을 효과적으로 포착하며, 다양한 종에 걸쳐 강력한 구분을 달성한다는 것을 보여줍니다. 외부 독립 데이터 세트에 대한 검증 결과, 모델의 일반화 성능은 계통 발생적 근접성이 아닌, 보존된 고유 모티프(예: GC 함량)에 의해 결정된다는 것을 확인했습니다. 또한, 개발된 알고리즘을 적용하여 추출된 모티프는 기존 연구보다 훨씬 높은 신뢰도를 가집니다. 마지막으로, Drosophila 6mA 사례 연구에서 얻은 경험적 증거를 바탕으로, '시퀀스-구조 시너지' 가설을 제시합니다. 이 가설은 GAGG 코어 모티프와 상류 A-트랙 요소가 함께 작동한다고 제안합니다. 우리는 또한 in silico 돌연변이 유발 실험을 통해 이 가설을 검증했으며, 이 두 요소 중 하나 또는 둘 다를 제거하면 모델의 인식 능력이 크게 저하된다는 것을 확인했습니다. 이 연구는 메틸화 예측을 위한 강력한 도구를 제공하며, 설명 가능한 딥러닝이 방법론적 혁신과 생물학적 가설 생성에 어떻게 기여할 수 있는지 보여줍니다.

Original Abstract

Accurate computational identification of DNA methylation is essential for understanding epigenetic regulation. Although deep learning excels in this binary classification task, its "black-box" nature impedes biological insight. We address this by introducing a high-performance model MEDNA-DFM, alongside mechanism-inspired signal purification algorithms. Our investigation demonstrates that MEDNA-DFM effectively captures conserved methylation patterns, achieving robust distinction across diverse species. Validation on external independent datasets confirms that the model's generalization is driven by conserved intrinsic motifs (e.g., GC content) rather than phylogenetic proximity. Furthermore, applying our developed algorithms extracted motifs with significantly higher reliability than prior studies. Finally, empirical evidence from a Drosophila 6mA case study prompted us to propose a "sequence-structure synergy" hypothesis, suggesting that the GAGG core motif and an upstream A-tract element function cooperatively. We further validated this hypothesis via in silico mutagenesis, confirming that the ablation of either or both elements significantly degrades the model's recognition capabilities. This work provides a powerful tool for methylation prediction and demonstrates how explainable deep learning can drive both methodological innovation and the generation of biological hypotheses.

0 Citations
0 Influential
14 Altmetric
70.0 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!