母语的听力优势反映在听觉皮层的注意相关活动上

【字体: 时间:2025年02月06日 来源:Communications Biology 5.2

编辑推荐:

  以汉语或德语为母语的人的脑磁图记录显示,与正在进行的语言开始同步的神经活动——被认为是语言前处理——在听母语语言时得到增强。

  

母语语音聆听优势的神经机制新解:基于听觉皮层注意力相关活动的研究


在当今神经科学与语言学交叉研究的前沿领域,关于母语语音聆听优势的神经基础探索一直备受瞩目。德国海德堡大学神经病学系的研究人员孟亮、Johannes Gerwien 和 Alexander Gutschalk 在《Communications Biology》期刊发表了题为 “A listening advantage for native speech is reflected by attention - related activity in auditory cortex” 的论文。这一研究成果意义重大,为深入理解人类语言处理的神经机制提供了关键依据,在语言学习、语音识别技术优化以及临床语言障碍治疗等方面都具有潜在的应用价值。

论文摘要指出,母语语音聆听优势广为人知,但背后的神经机制却一直不明确。研究团队利用脑磁图(MEG)技术,验证了 “听觉皮层中对母语语音的注意力增强更强” 这一假设。他们让双语者录制中文和德语音频,构建双语音流的 “鸡尾酒会” 场景,设置一致和不一致的语言组合。实验中,中文母语者和德语母语者分别在提示的目标语音流中执行检测任务。结果显示,注意力会增强从语音包络反卷积得到的时间响应函数中的负向活动,且目标语音流为母语时,该活动比非母语时更强;不一致语言刺激引发的活动比一致语言刺激更强。这表明母语语音的更强活动可能与对母语语音流更好的自上而下预测有关。

聆听母语语音在安静环境中通常毫不费力,但在存在竞争性语音或其他声源时,人们虽能从背景中分离出目标语音流,却会受到干扰。这种干扰源于多种因素,如耳蜗的直接能量掩蔽,它取决于语音和掩蔽信号的频谱重叠;目标和掩蔽语音流的相似性也影响着目标语音的感知和理解,例如不同性别语音流比同性别语音流更易分离 。除了这些基本的听觉场景分析机制相关因素外,语言因素在两个语音流的干扰中也起着重要作用。研究发现,听非母语语音时,信息掩蔽对表现的影响更大,母语语音掩蔽比非母语语音掩蔽对目标的干扰更强。

此前,脑电图(EEG)、脑磁图(MEG)和颅内脑电图(iEEG)研究表明,在双说话者场景中,听觉皮层中与语音包络时间锁定的活动会因注意力而增强,这种注意力对目标语音诱发信号的调制高度依赖于上下文。而对于母语和外语在神经活动上的差异,研究结果并不一致。有研究发现,噪声掩蔽下,外语语音的神经活动和 MEG 信号重建趋势更高;但也有研究表明,母语元音在听觉皮层中诱发的失匹配负波(MMN)比非母语元音更强 。这些相互矛盾的结果使得母语语音处理的神经机制更加扑朔迷离,亟待进一步研究。

在本次研究中,研究人员招募了 17 名 24 - 34 岁、对德语了解甚少且接触不多的中国母语者,以及 17 名 19 - 33 岁、之前没有中文知识的德国母语者。所有参与者听力正常,在提供书面知情同意后参与实验,实验程序获得海德堡大学医院伦理委员会批准。

实验刺激材料为从已出版传记中选取的中文和德语文本段落,由德中双语者以正常语速在隔音消声室录制。文本中主要人物的名字均替换为目标词 “Jack”,该名字预计两国参与者都知晓。录制完成后,对语音流进行处理,将时长超过 300ms 的停顿缩短至 300ms,把目标和掩蔽语音流分别剪切成 7s 和 6s 长的片段,并进行强度归一化,随后混合成一个刺激。部分刺激中,在混合前会单独播放完整的 7s 目标语音流进行预刺激。

实验分为两个阶段。第一阶段为未预刺激阶段,直接以 1s 长的目标提示开始刺激,每个条件有 30 次试验,每个条件的语音用于评估的时长为 3 分钟,四种条件(根据目标和掩蔽语音流的语言类型分类)的播放顺序在不同受试者间平衡。第二阶段为预刺激阶段,在混合刺激前先呈现一次目标语音流作为预刺激,且每个混合刺激在整个实验中仅使用一次。实验过程中,参与者需戴上插入式耳机,听平均声压级为 80dB 的语音流,按照指示专注于先开始的目标语音流,忽略后开始的掩蔽语音流,并在检测到目标词 “Jack” 时按下响应按钮。

MEG 数据记录前,先对受试者进行数字化处理,在头部两侧的乳突和太阳穴处附上四个头部位置指示(HPI)线圈,并数字化头部 100 个额外位置。MEG 数据通过 Neuromag - 122 全头系统以 1000Hz 的采样率在直接耦合模式下记录。记录完成后,删除噪声过大或信号严重丢失的通道,对数据进行 1 - 20Hz 的带通滤波和重采样至 128Hz,以便后续分析。

研究人员运用 mTRF 工具箱 2.0,采用时间响应函数(TRF)方法模拟语音包络在 MEG 响应中的编码过程。为避免问题不适定和过拟合,添加 L2 惩罚项并通过留一法交叉验证调整参数 lambda,以获得最高预测能力。利用 BESA 软件,基于数字化头部表面点拟合的球形头部模型进行源分析,将单个语音流(预刺激)的所有 TRF 平均值用于偶极子拟合,选择 P1 作为最稳定且信噪比最佳的成分进行偶极子模型构建,进而估计听觉皮层中所有条件下的 TRF 源波形。

在神经编码分析方面,评估 TRF 基于声学包络导数预测持续 MEG 信号的能力,通过计算预测和记录的连续 MEG 信号之间的相关系数得到预测准确性。分析在源空间中进行,使用拟合到单语音流 TRF 的 P1 的两个听觉皮层偶极子,并添加眼睛位置的两个区域源和一个模拟环境慢噪声的 PCA 成分到空间滤波器。采用留一法,从 80% 的数据中估计 TRF,并用剩余 20% 的数据进行测试,对每个数据集重复五次不同子集的测试,保留平均编码准确性用于组分析。

在行为学实验结果中,通过计算命中率、错误警报率和敏感性指数(d’)来评估参与者的表现。结果显示,不一致的目标 - 掩蔽组合的 d’值通常高于一致组合,表明不一致组合下参与者更能追踪目标语音流。同时,目标语音流为母语时具有优势,这在目标语言和听众组的交互作用中得到体现。此外,预刺激显著提高了 d’值,这得益于更高的命中率和更低的错误警报率。对于未预刺激且语言一致的语音流,d’值常不显著大于零,说明参与者难以分离这些语音流。

在单语音流的时间响应函数研究中,研究人员分析了用于预刺激的未掩蔽语音流的 TRF。源波形显示出平均潜伏期为 90ms 的正向峰值(P1)、150ms 的负向峰值(N1)和部分波形中 219ms 的第二个正向峰值(P2)。统计分析表明,中文语音刺激引发的 P1 和 P2 比德语音刺激更大,这可能与中文刺激的包络峰值率较低有关。同时,在 N1 和 P2 时间间隔内,存在刺激语言与听众组的显著交互作用,母语刺激在 N1 时间窗口的响应更负向,在 P2 时间窗口更弱。

在竞争语音流的时间响应函数分析中,基于未掩蔽语音流的 P1 源拟合来评估竞争语音流的 TRF。分析注意力效应时,定义 Nd 时间窗口为 150 - 250ms,在此窗口内,未发现半球的显著主效应或一阶交互作用。对 Nd 反映的注意力效应进行统计分析,结果显示,未预刺激条件下,注意力存在显著主效应,不一致的目标 - 掩蔽组合的注意力效应更强,且母语的注意力效应(Nd)更强,这体现在注意力、刺激语言和听众组的显著交互作用中。

研究人员还探究了预刺激的影响,通过将预刺激和未预刺激数据集进行 ANOVA 分析,发现预刺激在 150 - 250ms 的 Nd 时间窗口内引起了更负向的活动,但未观察到预刺激对注意力的预期交互作用。不过,在预刺激数据集中,注意力、刺激语言和听众组的交互作用以及刺激语言和听众组的交互作用仍然显著,而未预刺激试验中显著的注意力与目标 - 掩蔽一致性的交互作用在预刺激试验中不显著。

在神经编码分析结果中,编码分析证实了注意力在未预刺激和预刺激条件下的主效应,但未证实注意力、刺激语言和组的交互作用。分析还显示,中文语音刺激的编码更强,这可能受 P1 主导。进一步对 P1 和 Nd 时间窗口分别分析发现,Nd 时间窗口内,德国母语者对德国目标流的跟踪更强,中国母语者对中文掩蔽流的跟踪更强,且 P2 和 Nd 成分在 Nd 时间窗口存在非线性相互作用,这解释了 TRF 和编码分析结果的差异。

研究结果证实了研究假设,即当目标语音为母语时,聚焦于语音流与听觉皮层中更强的注意力相关活动有关,且当语音流由母语和外语组成时,注意力增强更明显。中文语音刺激的 P1 和 P2 的 TRF 幅度高于德语音刺激,可能与中文刺激较低的包络峰值率有关,而非感知响度差异。

在语音流分离任务中,当存在掩蔽语音时,任务难度显著增加,尤其是当掩蔽语音与目标语音语言相同时。母语在检测目标词时具有优势,预刺激通过提高命中率和降低错误警报率增强了 d’值,支持了语音流分离受预刺激支持的观点。

母语语音刺激的更强 Nd 响应可能与更精确的注意力资源分配有关,高水平的母语语言经验使听众能更好地预测后续语音元素,有助于在缺乏低水平分离线索时部署注意力。虽然此前研究未明确语言特异性语音线索能否增强听觉皮层的(注意力)处理,但本研究通过对比不同母语的听众群体,支持了语言特异性线索在听觉皮层注意力增强中的作用。

本研究在方法上有独特之处,采用单双语者录制双语音流的设计,减少了非语言线索的影响,使参与者更依赖语言特异性的自上而下线索。与以往研究相比,本研究聚焦于双语音流的分离任务,而非单语音流的感知,且对比了不同母语的听众群体,为研究语言特异性处理提供了新视角。

不过,研究也存在一定局限性。例如,预刺激和未预刺激块的顺序可能导致练习效应无法完全排除;编码分析中每个条件的语音间隔较短,可能影响对母语效应的研究;虽然发现了 P2 和 Nd 的非线性相互作用,但具体机制仍需进一步探究。未来研究可考虑改进实验设计,增加语音间隔时长,深入研究 P2 和 Nd 相互作用的神经机制,以更全面地揭示母语语音聆听优势的神经基础。

此次海德堡大学研究人员的成果,为母语语音聆听优势的神经机制研究开辟了新方向,虽然研究存在一定的局限性,但也为后续研究提供了明确的改进思路和研究方向。随着研究的不断深入,有望在语言学习、语音识别技术优化以及临床语言障碍治疗等领域取得更多突破,推动相关领域的发展。

涓嬭浇瀹夋嵎浼︾數瀛愪功銆婇€氳繃缁嗚優浠h阿鎻ず鏂扮殑鑽墿闈剁偣銆嬫帰绱㈠浣曢€氳繃浠h阿鍒嗘瀽淇冭繘鎮ㄧ殑鑽墿鍙戠幇鐮旂┒

10x Genomics鏂板搧Visium HD 寮€鍚崟缁嗚優鍒嗚鲸鐜囩殑鍏ㄨ浆褰曠粍绌洪棿鍒嗘瀽锛�

娆㈣繋涓嬭浇Twist銆婁笉鏂彉鍖栫殑CRISPR绛涢€夋牸灞€銆嬬數瀛愪功

鍗曠粏鑳炴祴搴忓叆闂ㄥぇ璁插爞 - 娣卞叆浜嗚В浠庣涓€涓崟缁嗚優瀹為獙璁捐鍒版暟鎹川鎺т笌鍙鍖栬В鏋�

涓嬭浇銆婄粏鑳炲唴铔嬬櫧璐ㄤ簰浣滃垎鏋愭柟娉曠數瀛愪功銆�

相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普
    • 急聘职位
    • 高薪职位

    知名企业招聘

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号