基于BiGRU+BiLSTM混合深度学习模型的脑电信号情绪识别研究
《IEEE Access》:Emotion Recognition from EEG Signals Using a Hybrid Deep Learning Approach
【字体:
大
中
小
】
时间:2025年12月11日
来源:IEEE Access 3.6
编辑推荐:
本研究针对脑机接口(BCI)中脑电信号(EEG)情绪识别准确率受限的难题,提出了一种结合双向门控循环单元(BiGRU)和双向长短期记忆网络(BiLSTM)的混合深度学习架构。该模型在Aston大学公开的EEG数据集上对三种情绪(积极、中性、消极)进行分类,取得了98.59%的最高准确率,显著优于单一模型。该成果为实时情感计算、辅助通信技术等应用提供了新思路。
想象一下,如果计算机能够读懂你的情绪——这不是科幻电影里的场景,而是脑机接口(BCI)技术正在努力实现的愿景。近年来,随着机器学习技术的飞速发展,基于脑电图(EEG)信号的情绪识别研究已成为神经科学和人工智能交叉领域的热点。这项技术对于心理健康评估、实时情绪监测以及为行动障碍人士(如肌萎缩侧索硬化症(ALS)或脊髓损伤患者)提供新型交互方式具有重大意义。
然而,这条探索之路充满挑战。EEG信号本质上是大脑神经元电活动的记录,极易受到环境噪声干扰,且存在显著的个体差异性。这些信号通常被分解为不同的频率波段,如δ(Delta)、θ(Theta)、α(Alpha)、β(Beta)和γ(Gamma)波,它们分别与不同的认知和情绪状态相关联。如何从这些复杂、高维且富含噪声的时间序列数据中,精准地捕捉到与特定情绪相关的模式,是研究人员面临的核心难题。尽管已有研究尝试使用长短期记忆网络(LSTM)、卷积神经网络(CNN)等模型,但在准确率和模型鲁棒性方面仍有提升空间。为此,发表在《IEEE Access》上的这项研究,提出了一种创新的混合深度学习模型,旨在更有效地攻克EEG情绪识别中的瓶颈问题。
为了提升情绪识别的性能,本研究团队设计并评估了一种结合了双向长短期记忆网络(BiLSTM)和双向门控循环单元(BiGRU)的混合神经网络架构。研究利用了英国阿斯顿大学( Aston University )公开的EEG Brainwave Dataset: Feeling Emotions数据集,该数据通过Muse EEG头带采集,包含两名受试者在观看能诱发积极、中性、消极情绪的视频片段时的脑电信号。数据处理关键步骤包括:信号以150Hz频率重采样,采用滑动窗口(1秒窗口,0.5秒重叠)进行分割,并提取了多达2548个统计和频谱特征。核心方法是对比三种模型:单独的BiLSTM模型、单独的BiGRU模型以及二者结合的BiGRU+BiLSTM混合模型。模型训练采用Adam优化器和分类交叉熵损失函数,并使用了丢弃法(Dropout)和批量归一化(Batch Normalization)来防止过拟合。
本研究的方法论系统阐述了开发EEG情绪分类模型的流程。核心是提出了一种结合BiLSTM和BiGRU的混合神经网络,以利用EEG数据的序列特性。数据集被随机打乱并按80%训练集和20%验证集划分。BiLSTM层设计用于捕捉序列中向前和向后的长期依赖关系,其通过遗忘门、输入门、输出门等机制(公式1-6)调控信息流。随后,BiGRU层(公式7-10)以更简洁的架构(更新门和重置门)补充捕捉短期时间动态模式。混合模型结合了二者的优势。模型中还加入了批量归一化(公式11-12)以加速训练并提高稳定性。最终通过全连接层和Softmax函数(公式13)输出三个情绪类别的概率。模型使用Adam优化器(公式14-17)最小化分类交叉熵损失(公式18)进行训练,并采用早停法防止过拟合。性能通过准确率(公式19)、精确度、召回率、F1分数等指标评估。
研究采用了三种模型进行对比评估:三层BiLSTM模型、三层BiGRU模型以及新提出的BiGRU+BiLSTM混合模型。所有模型均在相同的训练/验证集划分下进行训练。
损失函数曲线显示,混合模型取得了最低的最终验证损失,且收敛过程更稳定。准确率曲线表明,混合模型的测试准确率最高,达到约98.59%,优于BiGRU模型(98.13%)和BiLSTM模型(98.1%)。混淆矩阵分析进一步揭示,混合模型在所有三个情绪类别(消极、中性、积极)上的误分类数量最少,显示出其更优越的类别区分能力,特别是在区分消极和积极情绪方面。与其他已发表的研究模型(如CNN+GCN、随机森林+特征工程等)相比,本研究提出的混合模型在相同数据集上取得了最高的分类准确率。
实验结果表明,混合BiGRU+BiLSTM模型在准确率、损失、精确度、召回率和F1分数等所有评估指标上均一致优于单独的BiGRU和BiLSTM模型。该架构成功融合了BiGRU的计算效率和BiLSTM处理长程依赖的能力,为EEG信号中的复杂时间模式提供了一种平衡且高效的分类方案。这项研究不仅证明了混合深度学习模型在EEG情绪识别任务中的有效性,也为开发实时情感计算应用(如辅助沟通系统、自适应人机交互)奠定了坚实基础。展望未来,研究人员计划将模型应用于更广泛的情绪状态识别,并探索其在想象语音解码等领域的潜力,同时考虑整合多模态生理信号(如心电图(ECG)、皮电反应(GSR))以进一步提升系统的鲁棒性和普适性。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号