通过小波包合成增强和基于熵的信道选择进行运动想象脑电图(EEG)分类

《Frontiers in Neuroscience》:Motor imagery EEG classification via wavelet-packet synthetic augmentation and entropy-based channel selection

【字体: 时间:2025年11月11日 来源:Frontiers in Neuroscience 3.2

编辑推荐:

  脑机接口中的运动想象(MI)EEG解码受限于数据集规模小、噪声高和传感器冗余。本文提出统一框架,通过小波包分解结合频率域数据增强生成合成样本,利用小波包能量熵差异筛选关键通道(减少27%传感器),并设计三分支Transformer模型提取多尺度时空特征,最终通过投票机制分类。实验表明,该方法在BCI Competition IV 2a和Physionet MI数据集上平均准确率分别达86.81%和86.64%,显著优于基线模型(p<0.01),且无需额外记录。

  脑机接口(BCI)系统作为一种人脑与外部设备之间建立通信的桥梁,具有将用户意图转化为具体动作的潜力,无需依赖周围神经或肌肉。在众多BCI技术中,运动想象(Motor Imagery, MI)因其能够通过用户的思维活动激活对应的大脑区域,从而产生可识别的脑电图(EEG)信号,成为了研究的重点。然而,MI脑电分类面临着几个关键挑战:数据量有限、噪声干扰严重以及电极数量过多。这些问题限制了分类的准确性,同时也影响了其在临床应用中的可行性。为了应对这些挑战,本文提出了一种创新的统一框架,旨在提升分类性能、减少所需电极数量,并避免额外的信号采集。

本文的方法基于三个主要阶段的流程设计。首先,采用小波包分解(Wavelet-Packet Decomposition, WPD)将每个MI类别中的数据划分为低方差的“稳定”和高方差的“变异”样本。通过在匹配样本之间交换子频带,生成合成样本,从而在保持事件相关去同步/同步(event-related desynchronization/synchronization, ERD/ERS)特征的同时,增强数据的多样性。其次,利用小波包能量熵(Wavelet-Packet Energy Entropy, WPEE)量化频谱能量复杂度与类别可分性,选择最能代表分类能力的电极。第三,构建了一个轻量级的多分支网络,通过并行的膨胀卷积提取多尺度时间特征,再通过深度卷积优化空间模式,最后将融合后的时空张量输入Transformer编码器,借助多头自注意力机制学习全局时间依赖性。最终,通过软投票机制确定分类结果,从而提升分类的鲁棒性。

在BCI Competition IV 2a和PhysioNet MI数据集上的实验表明,该方法在去除27%的电极后,分别实现了86.81%和86.64%的平均分类准确率。这一结果优于使用全部22个通道训练的相同网络,并且配对的t检验结果也显示了显著的提升(p < 0.01)。这些成果不仅验证了方法的有效性,还展示了其在资源受限环境下的应用潜力。

本文的创新点在于将数据增强和电极选择统一在一种基于神经生理学的先验框架下。传统的数据增强方法通常依赖几何变换或人工特征生成,而本文的方法通过小波包分解和重构,实现了在频率域内的样本交换,从而生成具有生理合理性的合成信号。同时,电极选择采用小波包能量熵差异进行排序,选择最优电极组合,这不仅减少了冗余电极,还提高了分类性能。这种结合了频率域信息与空间特征提取的多分支架构,使得模型能够更有效地捕捉到EEG信号中的关键信息,从而在有限的数据条件下实现更精确的分类。

此外,本文还提出了一种基于小波包能量熵的通道选择方法,这种方法能够有效地识别出对分类任务贡献较大的电极,从而在减少电极数量的同时保持较高的分类性能。通过在训练数据中进行通道选择,并将其冻结用于测试数据,确保了评估的无偏性。实验结果显示,选择最优的12个电极能够达到与使用全部22个电极相当甚至更优的分类效果。这表明,通过合理的通道选择,可以显著提高模型的效率和准确性。

本文的网络架构采用了多分支的时空卷积和Transformer模块,通过并行的多尺度时间卷积提取局部时间特征,随后在空间维度进行卷积以增强空间模式的表达能力。接着,通过Transformer编码器捕捉全局的时间依赖性,结合多头自注意力机制对特征进行动态加权。最后,通过全连接层和软投票机制确定最终的分类结果。这种设计不仅兼顾了时间信息和空间信息,还通过Transformer的全局建模能力,弥补了纯卷积网络在捕捉长距离依赖方面的不足,从而在小样本、低密度数据场景下实现更加稳健和准确的MI解码。

为了进一步验证方法的有效性,本文在多个公开数据集上进行了实验,并通过统计方法(如配对t检验和Wilcoxon符号秩检验)对结果进行了显著性分析。结果显示,所提方法在多个数据集上均优于其他基线方法,且在多个统计检验中表现出显著的提升。此外,通过消融实验,验证了数据增强和通道选择对分类性能的独立贡献。实验表明,仅采用通道选择可以提高平均准确率1.74%,而仅采用数据增强则可以提高7.33%。结合两者后,准确率提升达到8.92%,这进一步说明了方法的协同优势。

在模型性能评估方面,本文使用了多种标准指标,包括准确率(Accuracy)、Kappa系数和F1分数。这些指标能够全面反映模型在分类任务中的表现。准确率衡量了模型在所有样本中正确预测的比例,Kappa系数则通过对比实际分类和随机分类之间的差异,评估模型的分类能力是否超越了随机水平。F1分数结合了精确率和召回率,反映了模型在平衡这些指标时的表现。实验结果显示,所提方法在多个指标上均优于其他基线方法,证明了其在分类任务中的有效性。

此外,本文还探讨了不同时间窗口长度对分类性能的影响。实验表明,4秒的时间窗口能够提供最佳的分类准确率,同时保持模型的大小和推理延迟在可接受的范围内。这表明,在实际应用中,选择适当的时间窗口可以有效提升模型的性能,同时不会显著增加计算负担。

在模型可解释性方面,本文采用了Grad-CAM方法对模型提取的特征进行可视化分析。通过反向传播仅关注目标类别的梯度,生成了每个电极对分类任务的贡献权重,并将其与特征图进行加权求和,最终通过ReLU函数保留正向贡献,生成热图。这些热图展示了模型在特定任务中的激活区域,例如C3/C4区域的激活,与运动皮层的对侧活动一致,从而增强了模型的可解释性。这种可解释性对于理解模型如何从EEG信号中提取关键信息至关重要,有助于改进模型设计和优化参数配置。

通过分析不同电极配置对分类性能的影响,本文还发现,电极的对称分布对分类效果有显著的提升作用。例如,选择12个主要电极加上4个辅助电极的配置,能够实现更高的分类准确率。这表明,电极的空间布局对于分类性能有重要影响,因此在实际应用中,合理选择电极位置可以显著提升系统的性能。

综上所述,本文提出的DACS-TBTrans方法通过结合数据增强和电极选择,有效提升了MI脑电分类的准确性,同时减少了所需的电极数量。这种方法不仅适用于当前的公开数据集,还具备在实际临床应用中的潜力。未来的研究将进一步探索该方法在更多数据集上的泛化能力,并尝试在不同的应用场景中优化其性能。此外,随着技术的发展,本文的方法也可以与其他先进的深度学习模型相结合,进一步提升分类效果和系统效率。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号