训练开启想象语音 BCI 新可能:解锁神经密码,助力语言障碍患者 “畅言”

【字体: 时间:2025年02月22日 来源:Communications Biology 5.2

编辑推荐:

  为解决语音 BCI 技能能否通过训练提升及相关神经机制问题,研究人员开展基于 EEG 的想象语音 BCI 训练研究。结果发现训练可提高 BCI 可控性,揭示了相关神经变化。该研究为改善 BCI 系统提供依据,推荐科研读者阅读。

  
在神经科学和医学领域,语言相关的神经系统疾病,像失语症、肌萎缩侧索硬化症以及闭锁综合征等,给患者和他们的照顾者带来了极大的困扰。这些疾病会严重破坏患者的自然语言能力,使他们难以正常交流,这不仅降低了患者的生活质量,也给照顾者增添了沉重的负担。

为了帮助这些患者重新获得语言交流的能力,科学家们想到了一个很厉害的办法 —— 利用脑机接口(Brain-Computer Interface,BCI)技术。这个技术的原理就是直接从神经生理信号中解码出患者想象中的语言,然后把它转化成文字、合成语音,甚至能控制虚拟形象说话。这听起来是不是特别神奇?但实现这个目标可不容易,面临着两大难题:一方面,要让机器准确地解码神经信号就很有挑战性;另一方面,患者怎么能更好地和这个解码器配合,也是个大问题。在这两个难题里,给用户提供实时反馈是非常关键的。

虽然近年来在语音 BCI 领域有了不少进展,比如通过颅内电生理记录解码尝试说出的话,解码速度甚至能达到每分钟约 78 个单词。但这种方法有个很大的局限性,对于那些语言产生区域受损的患者,像中风后出现表达性失语症的患者,就不太适用了。所以,更适合他们的 BCI 需要解码想象中的语言(也叫隐蔽或内心语言,指在内心产生语言但没有发出声音,不涉及肌肉骨骼系统)。虽然之前有研究探索过想象语言的神经关联,但大多是和公开语言对比着研究的,真正尝试实时解码想象语言的 BCI 研究并不多,而且效果也不太理想。这主要是因为想象语言信号比公开语言信号弱很多,很难精确识别语言想象的开始时间,不同人控制 BCI 的能力也不一样,再加上记录大脑活动的技术也有一定的限制。

另外,目前研究想象语言解码的主流方法是利用颅内记录,像皮层脑电图(ECoG)和立体定向脑电图(sEEG)。虽然这些方法能从关键语言区域进行神经采样,空间分辨率高,还能利用更高频率的神经活动,但它们也存在临床和伦理方面的问题。比如,使用这些方法可能会引发临床并发症,像电极接触不良、感染等,严重的话可能需要取出设备,患者就会失去新的交流方式,这对患者来说后果很严重。

还有一些研究用表面脑电图(EEG)来离线解码各种想象语言单位,不过几乎都是从工程学角度出发,主要目的是优化分类器来提高解码准确率。即便有大量的数据和复杂的解码器,离线分类的准确率还是不太理想,区分两个想象语言单位时准确率低于 80%,三类问题的准确率只有 60% 左右。在唯一一项使用 EEG 进行在线语音想象解码的 BCI 研究中,区分 “是” 和 “否” 的准确率也不到 70%,而且不同人之间的差异很大。由于缺乏语音想象 EEG-BCI 的研究,而且侵入性 BCI 研究大多是单病例研究,所以目前还不清楚语音 BCI 的技能能不能通过训练提高。

在这样的背景下,为了弄清楚语音 BCI 的可控性相关问题,来自 作者[第一作者单位] 的研究人员在《Nature Communications》期刊上发表了一篇名为 “Training improves controllability of an EEG-based imagined-speech brain–computer interface” 的论文。他们通过研究发现,健康人经过连续 5 天的训练,能够学会控制基于 EEG 的语音 BCI。而且,他们还揭示了与获得 BCI 控制技能相关的神经机制。这一研究结果意义重大,为改善当前基于语音想象的 BCI 系统提供了重要的理论依据,也为未来神经技术在语言障碍领域的应用带来了新的希望。

研究人员在这项研究中用到了几个关键的技术方法:首先,他们招募了 15 名健康的参与者(5 名女性,平均年龄 23.9 岁),让这些参与者连续 5 天进行实验,每天都要完成心理计时任务和 BCI 控制训练,在训练中想象发出 /f? / 和 /gi/ 这两个音节。其次,利用 64 通道的 ANT Neuro 系统记录参与者的 EEG 数据,同时用肌电图(EMG)记录面部肌肉活动,防止参与者不自觉地产生面部动作影响实验结果。然后,基于 Neurodecode 框架开发了 EEG-BCI 循环,包括离线和在线两个部分,离线部分用于校准分类器,在线部分让参与者实时控制视觉反馈。最后,运用了多种数据分析方法,比如线性混合模型(LMM)、Pearson 相关系数分析等,来研究 BCI 控制性能、分类器特征以及神经活动的变化。

下面我们来看看具体的研究结果:

  • 训练提高 BCI 控制能力和解码准确率:研究人员通过对连续 5 天接受连续反馈训练的参与者进行测试,发现他们的 BCI 控制平均性能从第 1 天到第 5 天呈现线性增长。这表明经过训练,参与者想象语言的能力提高了,不过不同人之间的差异还是很明显的。他们还发现,整个训练期间的平均 BCI 控制性能和个人学习斜率之间存在正相关关系,也就是说,表现越好的人从训练中获益越多。另外,通过计算分类器在离线数据上的交叉验证准确率,也发现这个准确率随着训练天数增加而提高,在线数据的交叉验证准确率同样如此,而且在线数据的准确率在训练过程中显著高于离线数据。
  • 分析分类器的特征:研究人员把参与者的表现和分类器区分两个音节想象的特征一起进行分析,发现个人 BCI 控制性能和特征权重之间有明显的相关性,这说明表现好的参与者的神经信号特征更有区分度。接着,他们研究了哪些频率带对音节区分的贡献最大,发现 α 和 β 区间最低端(8 - 16Hz)以及 γ 频段的贡献突出。而且,解码频率的分布和头皮上的位置有特定的关系,比如 8 - 16Hz 的峰值和左中央区域的一个集群有关,γ 频段的贡献来自双侧颞区和后枕区。另外,无论参与者接受的是连续反馈还是不连续反馈,解码频率和头皮位置的关系都很相似,这表明基于音节想象尝试控制 BCI 会激活一致的神经特征。
  • 与 BCI 控制学习相关的神经特征动态变化:研究人员观察分类器特征的全局变化,发现训练过程中特征权重总和呈线性增加。从频率和空间两个方面来看,随着训练的进行,最具区分度的特征始终集中在颞区,而且主要涉及 30Hz 以上的频率。进一步分析发现,2 - 10Hz 区间的特征权重贡献随着训练减少,52 - 66Hz 区间的贡献则增加,对应在大脑区域上,就是双侧颞区和额叶的低频贡献减少,左额颞区的高 γ 频段贡献增加。此外,他们还发现 BCI 控制性能的变化和特征空间的变化密切相关,表现越好的参与者,其特征在训练过程中的变化越大。
  • BCI 控制过程中的功率调制和训练期间的神经变化:研究人员研究了 BCI 控制训练过程中的神经变化,他们对比实时控制和基线活动时发现,α 频段在额叶和左中央电极处功率显著下降,β 频段也有类似但更广泛的下降,高 γ 频段在后枕部电极处功率增强。从训练期间的线性变化来看,所有频率带的功率都随着训练增加,其中 θ 和低 γ 频段的增加最为明显。
  • BCI 控制性能和训练期间的神经变化之间的关系:研究人员用线性混合模型分析 BCI 控制性能和功率调制的关系,发现一些电极集群存在正相关的交互作用,比如 θ 频段在额叶和中央区域、γ 频段在左颞区,这些区域的功率变化对 BCI 性能的影响随着训练增强,说明这些特定区域和频率在决定 BCI 控制方面的作用越来越重要。
  • 实时反馈在学习中的作用:为了研究准确的实时反馈对 BCI 控制改善的重要性,研究人员分析了接受不连续反馈训练的参与者的数据。结果发现,和接受连续反馈的参与者不同,这些参与者在训练过程中 BCI 控制性能并没有显著提高。进一步分析发现,连续反馈组在线数据的交叉验证准确率在训练过程中显著高于离线数据,而且比不连续反馈组的在线和离线数据准确率都高,这表明准确和一致的实时反馈对实现最佳性能至关重要。
  • 比较从 EEG 和 EMG 解码音节的情况:由于参与者在想象说话时可能会有残留的肌肉活动,研究人员就测试了 EMG 信号在区分两个音节中的作用。他们发现,离线时 EMG 数据的交叉验证准确率比 EEG 数据高,在线时则相反,EEG 数据的准确率更高,而且 EEG 在线数据的准确率在训练过程中有显著提高,EMG 在线数据则没有明显变化。这说明虽然语音想象可能伴随着亚阈值运动激活,但 EEG 信号不太受 EMG 活动的干扰,学习主要涉及隐蔽语言引起的神经活动变化。
  • 心理计时结果:研究人员还进行了心理计时测试,发现接受连续反馈的参与者在训练过程中,想象和说出音节的时间都减少了,而接受不连续反馈的参与者则相反,时间增加了。对于 “等时性偏离指数”,接受不连续反馈的参与者在训练过程中有显著增加,接受连续反馈的参与者则没有明显变化。而且,这个指数和 BCI 控制性能之间没有明显的相关性。

综合研究结果和讨论部分,这项研究意义非凡。它首次证明了健康人可以通过训练学会控制基于 EEG 的想象语音 BCI,揭示了相关的神经机制。研究发现实时反馈对学习过程至关重要,而且不同人在控制技能和学习斜率上存在很大差异。虽然研究过程中还存在一些未完全解决的问题,比如等时性测试可能不是衡量想象语言学习的最佳指标,语音想象时的残留 EMG 活动也存在争议,但这些都不影响研究成果的重要性。这项研究为改善基于语音想象的 BCI 系统提供了坚实的神经生理学基础,未来可以利用研究中确定的大脑区域和频率带来提高解码能力。同时,它也为神经技术在语言障碍领域的应用提供了新的思路,比如可以通过训练患者进行实时控制,筛选出最适合接受侵入性 BCI 治疗的患者,帮助更多语言障碍患者重新获得交流的能力,让他们的生活重新充满希望。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
    生物通微信公众号
    微信
    新浪微博

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号