NeuroFusionNet:一种融合手工与深度学习特征的EEG混合框架,用于实现精准可解释的阿尔茨海默病检测

《Scientific Reports》:NeuroFusionNet: a hybrid EEG feature fusion framework for accurate and explainable Alzheimer’s Disease detection

【字体: 时间:2025年12月16日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对阿尔茨海默病(AD)早期诊断中脑电图(EEG)计算模型存在鲁棒性、可解释性和临床可扩展性不足的问题,开发了名为NeuroFusionNet的混合深度学习框架。该研究通过融合手工设计的谱、统计、小波和熵特征与定制一维卷积神经网络(1D-CNN)提取的潜在时间嵌入,结合特征选择(PCC、PSO)和类别平衡(SMOTE)技术,在三个公共EEG数据集上实现了94.27%的准确率和0.94的宏F1分数,模型兼具轻量化(0.94M参数)和高效率(6.5 ms/样本推理),并通过SHAP和Grad-CAM提供了与病理生理学一致的可解释性,为AD的精准、可解释辅助诊断提供了新工具。

  
在全球老龄化趋势下,阿尔茨海默病(Alzheimer's Disease, AD)作为一种常见的神经退行性疾病,其早期诊断对于延缓病情进展至关重要。然而,现有的诊断方法往往依赖于临床症状和神经心理学评估,存在主观性强、发现晚等问题。脑电图(Electroencephalography, EEG)作为一种非侵入性、成本低且时间分辨率高的神经影像技术,能够捕捉到AD相关的细微神经动态变化,如theta/delta活动增强和alpha/beta功率降低等异常模式,为早期诊断提供了可能。尽管如此,当前基于EEG的计算模型仍面临鲁棒性不足、可解释性差以及临床推广难度大等挑战,限制了其在真实医疗场景中的应用。
为了突破这些瓶颈,一项名为NeuroFusionNet的创新性研究应运而生,并发表在《Scientific Reports》上。该研究旨在开发一个精准、可解释且高效的混合深度学习框架,用于基于EEG的AD及相关痴呆症的自动分类。研究人员巧妙地融合了手工设计的特征(包括谱、统计、小波和熵特征)与通过定制一维卷积神经网络(1D-CNN)自动学习到的潜在时间嵌入,从而结合了领域先验知识和数据驱动的抽象能力。为了提升模型性能,研究还采用了皮尔逊相关系数(PCC)和粒子群优化(PSO)进行特征选择,利用主成分分析(PCA)降维,并应用合成少数类过采样技术(SMOTE)处理类别不平衡问题。在信号预处理阶段,结合了带通滤波、伪影子空间重建(ASR)和独立成分分析(ICA)等多种技术,显著提升了EEG信号质量。最终,分类任务由一个五层深度神经网络完成,并采用了自适应学习率调度进行优化。
本研究主要采用了以下关键技术方法:研究利用了三个公共EEG数据集(OpenNeuro ds004504静息闭眼、ds006036静息睁眼和独立的OSF数据集)进行模型训练与验证。核心方法包括多阶段EEG预处理(滤波、ASR、ICA去噪)、混合特征提取(手工特征与1D-CNN自动特征)、特征融合与优化(PCC/PSO特征选择、SMOTE平衡、PCA降维),以及基于深度神经网络的分类模型构建。模型的可解释性通过SHAP和Grad-CAM技术实现,以揭示其决策依据。
数据采集与准备
研究使用了三个公开可用的EEG数据集以确保全面评估和泛化能力。OpenNeuro ds004504(闭眼)作为主要数据集,包含88名受试者(AD:36, FTD:23, CN:29)的静息态EEG。OpenNeuro ds006036(睁眼)数据集由相同的88名受试者在睁眼静息状态下记录,用于评估生理状态变化的影响。独立的OSF EEG数据集用于外部验证,包含109名受试者,其人口统计学和采集协议与前两个数据集不同。所有信号均经过预处理(陷波滤波、ICA去噪、Z-score标准化),并应用SMOTE技术解决类别不平衡问题。表7显示了SMOTE应用前后各类别的样本分布变化。
预处理
EEG信号容易受到眼电、肌电等非神经伪迹的干扰。NeuroFusionNet采用标准化的三步去噪流程:1-45 Hz带通滤波以抑制基线漂移和高频干扰;伪影子空间重建(ASR)用于衰减瞬态伪迹;独立成分分析(ICA)结合MARA(Multiple Artifact Rejection Algorithm)算法识别并移除非神经成分。定量评估表明,该预处理流程显著提升了信噪比(SNR)(约21%的增长)并降低了残余伪迹功率(RAP)(约36-38%的降低),同时保持了神经振荡信息的完整性(表8,表9)。图4直观展示了从原始EEG到清洁信号的预处理效果。
特征提取
特征提取阶段采用双流设计,结合了手工特征和自动学习特征。手工特征包括谱(如Delta, Theta, Alpha, Beta, Gamma频带的log功率)、小波(db4,5级分解的系数均值和标准差)、统计(均值、标准差、偏度、峰度)和熵(排列熵)等(表10)。自动特征通过一个轻量级1D-CNN从多通道EEG信号中提取,该网络包含三个卷积层,后接池化层(图6,表11)。手工特征和CNN特征被拼接后,经过SMOTE和PCA处理,形成最终的特征表示(表12,表13)。
分类网络与优化策略
分类模块是一个五层深度神经网络(DNN),包含全连接层、批量归一化(BN)、Dropout和LeakyReLU激活函数,并引入了跳跃连接以促进残差学习(表15,图7)。训练采用Adam优化器,初始学习率为3x10-4,并配合ReduceLROnPlateau调度器动态调整学习率。损失函数为带L2正则化的分类交叉熵。模型通过五折交叉验证进行训练和评估,确保了结果的可靠性(表14,表16)。
结果与讨论
在OpenNeuro ds004504(闭眼)数据集上,NeuroFusionNet取得了94.27%的准确率,宏F1分数为0.94,AUC为0.94,各类别的精确率、召回率和F1分数均表现均衡(表18)。五折交叉验证结果显示标准差极小(SD < 0.3%),证明了模型的稳健性和可重复性(表20)。消融实验(表17,表19)证实了混合特征融合、SMOTE平衡和PCA降维等关键组件的有效性。与现有方法相比,NeuroFusionNet在准确率上超越了多数基线模型(表31,表32),同时模型非常轻量(0.94M参数,4.1MB存储空间),在标准CPU上推理速度可达6.5毫秒/样本,满足实时部署需求(表21,表26)。
模型的可解释性通过SHAP和Grad-CAM实现。SHAP分析(图11,图13,图17)揭示了影响分类决策的关键特征,例如额叶theta功率增强和顶枕叶alpha功率降低,这些发现与已知的AD病理生理学(如后部alpha衰减和额叶theta增强)高度一致。Grad-CAM可视化(图15,图16)将模型的注意力映射到EEG通道和头皮拓扑空间,显示AD样本中模型更关注额叶和颞叶区域,这与AD的神经退化模式相符。这些解释性结果增强了临床医生对模型决策的信任。
模型在OpenNeuro ds006036(睁眼)数据集和独立OSF数据集上也表现出良好的泛化能力(表22,表23,表25),准确率分别达到92.15%和约89.5%,证明了其对于不同记录条件和人群的适应性(图14)。人口统计学公平性分析显示,模型在不同性别和年龄亚组中的性能差异极小(<0.6%),表明其具有公平的临床应用潜力(表27)。
结论与未来工作
NeuroFusionNet成功地将手工特征与深度学习特征融合,为基于EEG的AD检测提供了一个高精度、可解释、轻量化且高效的解决方案。该框架在多个数据集上验证了其卓越的性能和泛化能力,并通过先进的解释性技术将其决策过程与神经生理学知识联系起来,显著提升了模型的临床可信度和实用性。研究表明,融合领域知识和数据驱动表征的混合策略在复杂神经生理数据分析中具有明显优势。
未来,该框架有望进一步扩展,例如整合多模态神经影像数据(如fMRI,PET)、应用于疾病进展预测和MCI(轻度认知障碍)向AD转化的风险评估,以及部署到便携式EEG设备实现实时床边认知监测,从而为AD的早期筛查、诊断和干预管理提供更强大的工具。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号