2602.16072v2 Feb 17, 2026 cs.LG

Omni-iEEG: 대규모, 종합적인 iEEG 데이터셋 및 뇌전증 연구를 위한 벤치마크

Omni-iEEG: A Large-Scale, Comprehensive iEEG Dataset and Benchmark for Epilepsy Research

Chenda Duan
Chenda Duan
Citations: 17
h-index: 3
Yipeng Zhang
Yipeng Zhang
Citations: 335
h-index: 9
S. Kanai
S. Kanai
Citations: 24
h-index: 4
Yuanyi Ding
Yuanyi Ding
Citations: 48
h-index: 4
A. Daida
A. Daida
Citations: 268
h-index: 9
P. Yu
P. Yu
Citations: 42
h-index: 2
T. Zheng
T. Zheng
Citations: 5
h-index: 2
Naoto Kuroda
Naoto Kuroda
Citations: 58
h-index: 4
E. Asano
E. Asano
Citations: 57
h-index: 4
H. Nariai
H. Nariai
Citations: 119
h-index: 6
V. Roychowdhury
V. Roychowdhury
Citations: 80
h-index: 6
Shaun A Hussain
Shaun A Hussain
Citations: 42
h-index: 3

뇌전증은 전 세계적으로 5천만 명 이상의 환자에게 영향을 미치며, 이 중 약 3분의 1은 약물에 반응하지 않는 발작을 겪으며, 이 경우 수술이 발작 완화에 가장 효과적인 방법입니다. 정확한 뇌전증 발생 영역(EZ)의 위치는 뇌내 전기경로(iEEG) 데이터를 통해 파악할 수 있습니다. 그러나 현재 임상 워크플로우는 여전히 많은 노동력을 필요로 하는 수동 검토에 의존하고 있습니다. 동시에, 기존의 데이터 기반 접근 방식은 종종 단일 기관의 데이터셋으로 개발되며, 데이터 형식과 메타데이터가 일관되지 않고, 표준화된 벤치마크가 부족하며, 병리학적 사건에 대한 주석이 거의 제공되지 않아 재현성, 기관 간 검증 및 임상적 관련성을 저해하는 문제가 있습니다. 저희는 공개적으로 이용 가능한 다양한 소스의 이질적인 iEEG 데이터 형식, 메타데이터 및 녹음을 통합하기 위한 광범위한 노력을 통해 $ extbf{Omni-iEEG}$, 즉 대규모의 수술 전 iEEG 데이터 리소스를 구축했습니다. 이 데이터셋은 $ extbf{302명의 환자}$ 데이터를 포함하며, $ extbf{178시간}$의 고해상도 녹음을 제공합니다. 데이터셋에는 발작 시작 영역, 절제 범위, 수술 결과 등과 같은 표준화된 임상 메타데이터가 포함되어 있으며, 모든 데이터는 자격을 갖춘 뇌전증 전문의에 의해 검증되었습니다. 또한, Omni-iEEG는 36,000개 이상의 전문가가 검증한 병리학적 사건 주석을 제공하여 강력한 바이오마커 연구를 가능하게 합니다. Omni-iEEG는 머신러닝과 뇌전증 연구를 연결하는 역할을 합니다. 이 데이터셋은 임상적 선행 지식을 기반으로 통일된 평가 지표를 사용하여 임상적으로 의미 있는 작업을 정의하고, 이를 통해 임상적으로 관련된 환경에서 모델을 체계적으로 평가할 수 있도록 합니다. 벤치마킹 외에도, Omni-iEEG는 긴 iEEG 세그먼트에 대한 엔드-투-엔드 모델링의 잠재력을 보여주고, 신경생리학적 영역 이외의 영역에서 사전 훈련된 표현의 전이 가능성을 강조합니다. 이러한 모든 기여를 통해 Omni-iEEG는 재현 가능하고, 일반화 가능하며, 임상적으로 적용 가능한 뇌전증 연구의 기반을 마련합니다. 데이터셋 및 코드 링크가 포함된 프로젝트 페이지는 omni-ieeg.github.io/omni-ieeg 에서 확인할 수 있습니다.

Original Abstract

Epilepsy affects over 50 million people worldwide, and one-third of patients suffer drug-resistant seizures where surgery offers the best chance of seizure freedom. Accurate localization of the epileptogenic zone (EZ) relies on intracranial EEG (iEEG). Clinical workflows, however, remain constrained by labor-intensive manual review. At the same time, existing data-driven approaches are typically developed on single-center datasets that are inconsistent in format and metadata, lack standardized benchmarks, and rarely release pathological event annotations, creating barriers to reproducibility, cross-center validation, and clinical relevance. With extensive efforts to reconcile heterogeneous iEEG formats, metadata, and recordings across publicly available sources, we present $\textbf{Omni-iEEG}$, a large-scale, pre-surgical iEEG resource comprising $\textbf{302 patients}$ and $\textbf{178 hours}$ of high-resolution recordings. The dataset includes harmonized clinical metadata such as seizure onset zones, resections, and surgical outcomes, all validated by board-certified epileptologists. In addition, Omni-iEEG provides over 36K expert-validated annotations of pathological events, enabling robust biomarker studies. Omni-iEEG serves as a bridge between machine learning and epilepsy research. It defines clinically meaningful tasks with unified evaluation metrics grounded in clinical priors, enabling systematic evaluation of models in clinically relevant settings. Beyond benchmarking, we demonstrate the potential of end-to-end modeling on long iEEG segments and highlight the transferability of representations pretrained on non-neurophysiological domains. Together, these contributions establish Omni-iEEG as a foundation for reproducible, generalizable, and clinically translatable epilepsy research. The project page with dataset and code links is available at omni-ieeg.github.io/omni-ieeg.

1 Citations
0 Influential
4.5 Altmetric
23.5 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!