EEG 数据癫痫发作分类模型:重训与评估,为临床诊断精准赋能

【字体: 时间:2025年05月03日 来源:Scientific Reports 3.8

编辑推荐:

  癫痫诊断中 EEG 数据手动标注耗时久,现有机器学习模型临床实践精度低。研究人员复现评估多种模型,发现随机森林和卷积神经网络在公共数据表现好,但本地数据测试精度降。该研究为临床癫痫诊断提供参考,助力提升诊断精度。

  在神经疾病的世界里,癫痫是一位 “常客”,它如同隐藏在大脑中的 “捣蛋鬼”,时不时引发神经元的异常 “狂欢”,导致患者出现各种症状。据世界卫生组织(WHO)统计,全球约有 5000 万人饱受癫痫之苦。脑电图(EEG)作为癫痫诊断的重要手段,能捕捉大脑的电活动,为医生提供关键线索。然而,手动标注 EEG 数据中的癫痫发作部分,就像大海捞针,不仅耗时费力,还容易出错。
为了攻克这一难题,来自哥伦比亚洛斯安第斯大学(Universidad de Los Andes)、哥伦比亚儿科慈善医院基金会(Fundación Hospital Pediátrico La Misericordia)等机构的研究人员踏上了探索之旅。他们的研究成果发表在《Scientific Reports》上,为癫痫诊断带来了新的希望。

研究人员开展了一项关于从 EEG 数据中进行癫痫发作分类的机器学习和深度学习模型的再训练与评估的研究。他们的目标是找到能在临床环境中精准诊断癫痫的模型,提高诊断的准确性和效率。

在研究过程中,研究人员使用了多种关键技术方法。首先,他们收集了三个公共数据库(CHB - MIT、AUB、NICU)的数据用于模型训练,还获取了哥伦比亚儿科慈善医院基金会(HOMI)一位患者的手动标注 EEG 数据用于测试。然后对数据进行预处理,包括滤波、通道信息整理和下采样等操作。接着计算了 1998 个特征,用于训练经典机器学习模型。对于深度学习模型,则直接使用预处理后的数据进行训练。

研究结果如下:

  • 经典机器学习模型评估:使用不同特征子集和所有特征组合训练多种经典机器学习模型。以随机森林分类器(RFC)表现最佳,其受试者工作特征曲线下面积(AUROC)达 0.972,F1 分数在测试数据上也较高。经过网格搜索优化参数后,模型性能进一步提升。
  • 深度学习模型评估:复现并重新训练多种神经网络架构构建深度学习模型。卷积神经网络(CNN1)表现突出,AUROC 达到 0.977 ,F1 分数也较高。
  • 最佳训练模型在 HOMI 临床数据中的评估:将上述表现好的模型在 HOMI 数据上测试时,发现所有模型性能大幅下降。RFC 结合所有特征和仅使用小波特征的模型在新数据上表现相对较好,而之前在公共数据中表现最佳的 CNN1 在 HOMI 数据上表现最差。研究人员还发现不同模型存在不同类型的错误,如 CNN1 和 CNN3 有大量误报,深度卷积神经网络(DCNN)有大量漏报。
  • 检测模型的计算效率:RFC 结合所有特征的模型训练时间最长,神经网络模型在分类任务中速度最快。

研究结论和讨论部分指出,虽然之前的研究提出了很多基于机器学习和深度学习的癫痫检测方法,在控制测试数据集上准确率很高,但在实际临床应用中却大打折扣。本研究使用更多样化的数据集进行训练和测试,一定程度上解决了基准数据集变异性的问题。经典方法中,随机森林模型能有效处理不同类型的特征,表现最佳。深度学习模型对数据质量和特征敏感,尽管研究人员进行了预处理,但仍无法将在公共数据上的高准确率转移到 HOMI 数据上。此外,临床变量不匹配、手动标注的准确性、数据格式差异等都可能是导致模型准确率差异的原因。

这项研究意义重大,它系统评估了多种机器学习和深度学习模型在癫痫检测中的性能,为临床医生和研究人员提供了有价值的参考。研究人员还公开了训练的模型和代码,方便其他研究小组进一步研究。这有望推动机器学习技术在癫痫诊断中的应用,提高癫痫诊断的准确性和及时性,为全球癫痫患者带来更好的诊断和治疗方案,让他们能早日摆脱癫痫的困扰。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号