一种深度混合的CSAE-GRU框架,采用两阶段平衡机制,利用从脑电图(EEG)中提取的特征实现自动癫痫发作检测
《Frontiers in Neuroscience》:A deep hybrid CSAE-GRU framework with two-stage balancing for automatic epileptic seizure detection using EEG-derived features
【字体:
大
中
小
】
时间:2025年11月12日
来源:Frontiers in Neuroscience 3.2
编辑推荐:
癫痫发作检测框架通过整合CSAE-GRU模型和两阶段数据平衡策略,显著提升分类性能。采用Bonn和CHB-MIT数据集,通过五级离散小波变换提取时频域特征,结合聚类中心下采样和边界少样本过采样解决类别不平衡。实验显示,该模型在Bonn数据集准确率达98.46%,敏感性和特异性均超98%;在CHB-MIT数据集表现更优,准确率99.49%,AUC达99.57%。相较于传统CNN、GRU及单一模型,CSAE-GRU在保持低计算复杂度(Bonn平均耗时1.21秒/折)的同时,通过参数迁移学习增强特征表示能力,在多个分类任务中均优于现有方法。
癫痫是一种常见的神经系统疾病,其特征是大脑中异常的神经元放电,给临床诊断带来了持续的挑战。本研究提出了一种高性能的癫痫发作检测框架,结合了先进的特征提取和分类技术,利用脑电图(EEG)信号实现自动化诊断。研究重点在于解决EEG数据中存在的严重类别不平衡问题,并通过引入混合深度学习模型来提升模型的泛化能力和分类效果。以下是对该研究的详细解读。
### 一、研究背景与意义
癫痫是影响各年龄段人群的常见神经系统疾病,其主要原因是大脑神经元的异常放电。在所有神经系统疾病中,癫痫的发病率仅次于脑血管疾病,具有较高的临床重要性。癫痫的类型多种多样,包括局灶性癫痫、全面性癫痫、特发性癫痫和继发性癫痫等。癫痫发作通常伴随着意识丧失和抽搐,严重时可能导致不可逆的脑损伤、休克甚至致命后果。因此,癫痫的诊断和治疗对于保障患者健康具有重要意义。
EEG是一种通过记录大脑神经元在头皮表面产生的电信号,以评估大脑活动的方法。它通过将电极贴附在患者头皮上,捕捉大脑的电活动,具有成本低、操作简便等优势。然而,传统的EEG诊断方法依赖于专家医生的判断,容易受到主观因素的影响,从而导致误诊。此外,癫痫发作在不同患者中表现出显著的差异性,同一患者的EEG信号在不同发作时间也可能呈现波动性。因此,开发一种智能诊断系统,能够自动且准确地识别癫痫发作,对于临床实践具有重要的现实意义。
随着人工智能技术的发展,越来越多的研究将机器学习和深度学习应用于癫痫检测。这些方法通过提取EEG信号的特征,并利用分类模型进行判断,提高了诊断效率和准确性。然而,现有的方法在面对类别不平衡问题时往往表现不佳,因为大多数癫痫样本数量远少于非癫痫样本,导致模型倾向于预测多数类样本,从而影响其在实际应用中的性能。此外,一些深度学习模型直接处理原始或滤波后的EEG信号,缺乏对时间频率特征的充分挖掘,这在一定程度上限制了模型的分类能力。因此,开发一种能够有效处理类别不平衡问题、结合时间频率特征提取与深度学习分类的模型,是癫痫检测领域亟待解决的问题。
### 二、研究方法与技术路线
本研究提出了一种结合了聚类中心下采样、边界合成少数类过采样技术(BLSMOTE)和卷积稀疏自编码器(CSAE)与门控循环单元(GRU)相结合的混合分类模型,用于癫痫发作的检测。该方法分为三个主要阶段:数据预处理、特征提取和分类模型构建。
#### 2.1 数据预处理
原始EEG信号具有高动态性和非平稳性,且常受到生理噪声、环境噪声和工业频率信号(如50/60 Hz)的干扰。为确保后续分析的准确性和可靠性,首先采用五阶巴特沃斯带通滤波器对原始信号进行滤波处理,频率范围设定为0.5至60 Hz。该滤波器能够有效去除低频漂移、基线波动和部分电源干扰,提高信号的信噪比。此外,为了进一步提取时间频率特征,采用离散小波变换(DWT)对信号进行多尺度分解,将原始信号分解为多个子带信号,从而捕捉不同频率范围内的局部特征。
#### 2.2 特征提取
在本研究中,从每个子带中提取了四种代表性特征:均值绝对值(MAV)、标准差(STD)、功率谱密度(PSD)和模糊熵(FuEn)。这些特征能够有效描述EEG信号的波动性、能量分布和非线性特征。对于Bonn数据集,由于其为单通道EEG信号,特征矩阵的大小为N × 24(N表示EEG段数)。而对于CHB-MIT数据集,其包含23个EEG通道,因此特征矩阵的大小为N × 552。每行代表一个EEG段,每列对应一个提取的特征。其中,80%的特征样本用于训练,20%用于测试。为了应对类别不平衡问题,测试集保留了原始类别分布,以更好地反映临床实际情况。
#### 2.3 数据平衡策略
由于EEG数据通常存在严重的类别不平衡问题,本研究提出了一种两阶段的数据平衡策略。第一阶段采用基于聚类中心的下采样方法,减少非癫痫样本的数量,将非癫痫与癫痫的样本比例调整为2:1。第二阶段采用BLSMOTE过采样技术,对癫痫样本进行合成,以实现完全的类别平衡。与传统的SMOTE方法不同,BLSMOTE专注于在决策边界附近生成合成样本,从而避免冗余和引入噪声。这种方法在特征空间中进行合成,保留了数据的生理可解释性,同时避免了对原始EEG信号的直接操作可能带来的数据失真。
#### 2.4 分类模型设计
本研究提出了一种混合模型CSAE-GRU,结合了卷积稀疏自编码器(CSAE)和门控循环单元(GRU)的特性。CSAE负责学习稀疏且具有判别性的特征表示,而GRU则用于捕捉时间序列中的时序依赖关系。在模型构建过程中,首先对CSAE进行预训练,提取出具有判别性的特征表示,然后将预训练的编码器权重转移到GRU分类器中,以提升特征表示能力和模型泛化能力。CSAE的编码器通过卷积操作捕捉相邻特征之间的局部依赖关系,逐步增加通道数量,从1增加到32,再减少到16。每个卷积块包括批量归一化(Batch Normalization)、ReLU激活函数和Dropout正则化,以增强模型的稀疏性和防止过拟合。解码器则通过反向过程逐步恢复通道数量,从16恢复到1,以重构原始特征图。该模型的训练过程通过一个结合重构损失和稀疏性约束的损失函数进行优化。
### 三、实验结果与分析
本研究在两个公开数据集上进行了实验验证:Bonn数据集和CHB-MIT数据集。实验结果表明,该方法在Bonn数据集上的准确率、灵敏度、特异性、精确度、F1分数和AUC分别为98.46%、98.27%、98.50%、98.36%、98.31%和98.23%;在CHB-MIT数据集上的表现更为优异,准确率、灵敏度、特异性、精确度、F1分数和AUC分别为99.49%、99.21%、99.77%、99.49%、99.35%和99.57%。这些结果验证了该方法在癫痫检测任务中的有效性。
为了进一步验证模型的有效性,本研究还与多个现有方法进行了对比。其中包括传统的卷积神经网络(CNN)、门控循环单元(GRU)、CNN-GRU以及CSAE-MLP等模型。实验结果表明,CSAE-GRU模型在所有评估指标中均优于其他模型。例如,在Bonn数据集上,CSAE-GRU的准确率比CNN提高了1.68%,比CNN-GRU提高了2.94%。而在CHB-MIT数据集上,CSAE-GRU的准确率比CNN提高了1.67%,比GRU提高了1.61%。这些结果表明,CSAE在特征提取中的稀疏性优势和GRU在时序建模中的能力,是模型表现优异的关键因素。
此外,通过接收者操作特征(ROC)曲线的分析,进一步验证了模型的分类能力。在Bonn数据集的A-E分类任务中,CSAE-GRU的AUC值达到99.89%,在CHB-MIT数据集的Pt01分类任务中,AUC值为99.56%。这表明该模型在不同分类任务中均能实现高精度的分类。同时,模型在低误报率的情况下仍能保持高真阳性率,说明其在实际应用中具有较强的鲁棒性。
### 四、模型结构与性能评估
本研究提出的CSAE-GRU模型结构清晰,具有较强的可解释性。模型的整体流程如图2所示,包括数据预处理、特征提取、数据平衡和分类四个阶段。在特征提取阶段,模型从每个子带中提取四个关键特征,包括MAV、STD、PSD和FuEn。在数据平衡阶段,采用两阶段策略,通过聚类中心下采样和BLSMOTE过采样相结合的方法,解决类别不平衡问题。在分类阶段,模型将CSAE的编码器权重转移到GRU分类器中,以提升分类效果。
在性能评估方面,本研究采用五折交叉验证的方法,以确保模型的泛化能力。对于Bonn数据集,模型的平均运行时间约为1.21秒/折,总运行时间为6.17秒。对于CHB-MIT数据集,平均运行时间约为58.69秒/折,总运行时间为300.83秒。整个实验过程中,MATLAB内存消耗稳定在8.2–8.5 GB之间,表明该模型在计算效率方面表现良好。
在不同分类任务中,模型的性能表现也有所不同。例如,在Bonn数据集的A-E和C-E分类任务中,模型能够实现100%的特异性,而在D-E和CD-E任务中,模型实现了100%的灵敏度,说明其在某些特定分类任务中具有极高的识别能力。然而,在CHB-MIT数据集的Pt14任务中,模型的性能略有下降,这可能与个体间差异、癫痫发作部位和EEG记录配置等因素有关。因此,未来的研究应进一步优化模型的泛化能力,以适应更多样化的患者群体。
### 五、讨论与展望
本研究提出了一种新颖的癫痫检测框架,结合了聚类中心下采样、BLSMOTE过采样和CSAE-GRU混合模型。该方法在解决类别不平衡问题方面表现出色,同时在特征提取和分类建模中也具有一定的优势。通过在特征空间中进行合成,BLSMOTE不仅提高了少数类样本的数量,还避免了对原始数据的直接操作可能带来的噪声干扰。
尽管该模型在多个数据集上表现优异,但仍存在一些局限性。首先,研究仅基于两个公开数据集进行实验,这些数据集虽然广泛用于基准测试,但可能无法完全反映临床EEG记录中的复杂性和噪声水平。其次,目前的研究仅限于二分类任务,即区分癫痫发作与非癫痫状态。未来的研究可以进一步扩展模型,使其能够识别多种类型的癫痫,并测试其在更大规模、更具异质性的临床数据集上的表现。
此外,随着计算资源的限制,研究还可以探索更轻量级的模型版本,以实现模型在便携式或嵌入式EEG设备上的高效运行。同时,结合其他先进的特征提取方法,如深度学习和自适应算法,可以进一步提升模型的性能。未来的研究还应关注模型在不同患者群体中的适应性,以及如何优化模型的泛化能力,以提高其在实际临床环境中的可靠性。
### 六、总结
本研究提出了一种结合数据平衡策略和混合深度学习模型的癫痫检测方法。通过两阶段的数据平衡策略,有效解决了类别不平衡问题,提升了模型的分类能力。同时,通过将CSAE与GRU相结合,模型不仅能够提取稀疏且具有判别性的特征,还能捕捉时间序列中的动态变化,从而实现高精度的分类。实验结果表明,该方法在Bonn和CHB-MIT数据集上均取得了优异的性能,显示出在癫痫检测领域的巨大潜力。
尽管该方法在多个方面表现出色,但仍存在一些挑战。例如,如何在更复杂的临床环境中保持模型的稳定性,以及如何在不同患者之间实现更好的泛化能力,都是未来需要解决的问题。此外,模型的计算效率和内存占用情况也需要进一步优化,以适应资源受限的环境。总的来说,本研究为癫痫的自动检测提供了一种新的思路,具有重要的理论和应用价值。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号