2601.22197v2 Jan 29, 2026 cs.LG

뇌 신호가 실제 환경에서 임상 기록을 생성한다

Neural Signals Generate Clinical Notes in the Wild

Jathurshan Pradeepkumar
Jathurshan Pradeepkumar
Citations: 106
h-index: 5
Jimeng Sun
Jimeng Sun
Citations: 63
h-index: 4
Zheng Chen
Zheng Chen
Citations: 23
h-index: 3

장기간 뇌파(EEG) 기록으로부터 비정상 패턴, 진단 결과 및 임상적 해석을 요약하는 임상 보고서 생성은 여전히 많은 노력이 필요한 작업입니다. 본 연구에서는 9,048명의 환자로부터 얻은 약 11,000시간 분량의 뇌파 기록과 연결된 9,922개의 임상 보고서로 구성된 대규모 임상 뇌파 데이터셋을 구축했습니다. 이를 바탕으로, CELM이라는 첫 번째 임상 뇌파-언어 기반 모델을 개발했습니다. CELM은 다양한 길이의 장기간 뇌파 기록을 요약하고, 뇌파 기록 설명, 기본 활동, 간질 관련 이상, 사건/발작, 그리고 종합 의견 등 다양한 수준에서 임상 보고서 생성을 수행할 수 있습니다. 실험 결과, 환자 병력 정보를 활용했을 때, 제안하는 방법은 표준 생성 지표(예: ROUGE-1 및 METEOR)에서 평균 70%에서 95%의 상대적인 성능 향상을 달성했습니다(0.2-0.3에서 0.4-0.6으로). 환자 병력 정보 없이 zero-shot 설정에서는 CELM이 0.43-0.52의 생성 점수를 달성하여, 기준 모델의 0.17-0.26에 비해 우수한 성능을 보였습니다. CELM은 사전 훈련된 뇌파 기반 모델과 언어 모델을 통합하여 확장 가능한 다중 모드 학습을 가능하게 합니다. 개발된 모델과 벤치마크 구축 파이프라인은 https://github.com/Jathurshan0330/CELM 에서 확인할 수 있습니다.

Original Abstract

Generating clinical reports that summarize abnormal patterns, diagnostic findings, and clinical interpretations from long-term EEG recordings remains labor-intensive. We curate a large-scale clinical EEG dataset with $9{,}922$ reports paired with approximately $11{,}000$ hours of EEG recordings from $9{,}048$ patients. We therefore develop CELM, the first clinical EEG-to-Language foundation model capable of summarizing long-duration, variable-length EEG recordings and performing end-to-end clinical report generation at multiple scales, including recording description, background activity, epileptiform abnormalities, events/seizures, and impressions. Experimental results show that, with patient history supervision, our method achieves $70\%$-$95\%$ average relative improvements in standard generation metrics (e.g., ROUGE-1 and METEOR) from $0.2$-$0.3$ to $0.4$-$0.6$. In the zero-shot setting without patient history, CELM attains generation scores in the range of $0.43$-$0.52$, compared to baselines of $0.17$-$0.26$. CELM integrates pretrained EEG foundation models with language models to enable scalable multimodal learning. We release our model and benchmark construction pipeline at https://github.com/Jathurshan0330/CELM.

2 Citations
0 Influential
30.547189562171 Altmetric
154.7 Score
Original PDF
4

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!