编辑推荐:
为解决言语 - 言语同步测试(SSS 测试)双峰结果的成因争议,墨西哥国立自治大学的 M. Florencia Assaneo 开展相关研究,发现不同组听觉 - 运动整合能力有差异。该研究对理解听觉 - 运动同步神经机制意义重大,推荐科研读者阅读。
墨西哥国立自治大学(National Autonomous University of Mexico)神经生物学研究所的 M. Florencia Assaneo 在《Communications Biology》期刊上发表了名为《Reply to: The timing of speech-to-speech synchronization is governed by the P-center》的论文。这篇论文聚焦于言语到言语同步(speech-to-speech synchronization,SSS)这一关键领域,对深入理解人类听觉 - 运动同步能力有着重要意义,它为探究大脑在语言处理过程中的神经机制提供了新的视角,有助于进一步明晰个体在语言学习和交流方面存在差异的原因。
研究背景
在言语 - 言语同步测试(SSS 测试)中,研究人员观察到了双峰结果(bimodal outcome)。以往研究对于这一结果的解释存在争议,有观点认为该结果可能是 “P 中心效应(P-center effect)” 的副产品,而非参与者听觉 - 运动同步能力的反映。P 中心是指在语音感知中,人们倾向于将一个音节或韵律单元的感知中心定位在其声学能量峰值附近的某个位置,它在语音节奏感知方面起着重要作用。然而,M. Florencia Assaneo 认为,参与者听觉 - 运动能力的差异才是对双峰分布更直接的解释。此前的研究没有充分探究感知 P 中心在双峰结果中的作用,这一争议点促使 M. Florencia Assaneo 开展深入研究,以明确究竟是哪种因素在言语 - 言语同步中占据主导地位。
研究方法
- 刺激设计:研究团队没有采用与节拍器同步产生音节的方式,而是聚焦于感知和产生信号的连续物理属性 —— 包络(envelope)。包络是指信号在时间上的总体幅度变化,是听觉皮层在处理语音或音乐时主要加工的声学属性之一。他们设计了具有清晰节奏包络的刺激(图 1a) ,这种刺激能够突出包络的节奏特征,为后续研究奠定基础。
- 同步性测量:通过估计产生的语音包络和刺激包络之间的锁相值(phase-locking value),来测量两个连续信号之间相位滞后的稳定性(图 1b)。锁相值可以量化两个信号在时间上的同步程度,数值越高表示同步性越好。这一测量方法能够精准地评估参与者在言语 - 言语同步任务中的表现,为分析双峰结果提供了客观的数据支持。
- 实验任务设计:研究设置了多种实验任务版本。在一种版本中,引入了难以察觉的音节速率增量,以此观察高同步者(high synchronizers)的反应;还设置了隐式版本的测试,参与者未被明确要求同步,而是执行正交的音节回忆任务,同时记录他们在 “tahs” 发音过程中的相关数据,以此来探究低同步者(low synchronizers)的行为模式。
研究结果
- 包络节奏的作用:听觉皮层在处理语音时会追踪语音的包络,并且在言语产生过程中,运动区域的大脑活动与产生的语音包络密切相关。通过对刺激包络和产生语音包络的锁相值测量,发现了双峰结果,这表明在高同步者中,听觉区域和运动区域之间存在同步,而低同步者则不存在这种同步。这一结果说明,基于包络的节奏特征在言语 - 言语同步中起着关键作用,高同步者能够更好地利用包络信息实现听觉 - 运动同步。
- 高同步者的反应:当引入难以察觉的音节速率增量时,高同步者能够迅速调整自己的速率(图 1c)。这一现象与 “高同步者忽略精确声学定时,仅遵循大致与听觉提示相符的速率” 这一观点相矛盾,说明高同步者并非忽视精确的声学信息,而是能够对其做出快速、自动的反应。此外,高同步者和低同步者在报告对呈现速率变化的感知方面没有差异(图 1d),这进一步反驳了两组在感知节奏方面存在差异的观点。
- 低同步者的行为模式:在隐式版本的测试中,即使参与者没有被要求同步,仍然出现了双峰结果。而且,低同步者在同步策略上并不统一,他们有的节奏较快,有的较慢,速率稳定性也存在差异。这表明低同步者并非像之前认为的那样,统一采用某种同步策略,而是存在个体差异。
- 音乐经验与同步能力的关系:研究发现,高同步者比低同步者拥有更多的音乐经验。众所周知,音乐家通常比非音乐家表现出更卓越的听觉 - 运动同步能力。在面对由相同声学单元重复组成的序列(如单一音调或 “go” 音节)时,尽管双峰效应消失,但低同步者的表现仍然不如高同步者。这充分支持了低同步者在听觉 - 运动同步技能方面确实不如高同步者的假设。
- 反馈与前馈控制机制的影响:有观点认为,观察到的分组现象可能源于言语产生过程中反馈和前馈控制机制(feedback and feedforward control mechanisms)之间相互作用的个体差异。但研究发现,当参与者被要求与刺激同步拍手而非轻声说 “tah” 时,双峰分布仍然存在。这说明双峰分布的产生并非仅仅依赖于特定的言语产生任务,可能存在更普遍的机制在起作用。
研究结论与讨论
综合上述研究结果,M. Florencia Assaneo 认为,不同组参与者之间在听觉 - 运动整合能力上存在质的差异,这一假设相较于 “双峰结果是 P 中心效应的副产品” 这一假设更具说服力。尽管如此,研究人员也认识到未来研究 P 中心作用的重要性,因为这将有助于更清晰地分辨这两种解释。
这项研究具有多方面的重要意义。从基础研究角度来看,它进一步揭示了人类听觉 - 运动同步的神经机制,加深了人们对大脑在语言处理过程中如何协调听觉和运动功能的理解。在语言学习领域,该研究结果为解释个体在语言学习能力上的差异提供了新的理论依据,可能有助于开发更有针对性的语言学习方法。例如,对于听觉 - 运动同步能力较弱的学习者,可以设计专门的训练方案来提高他们的同步能力,进而促进语言学习。在医学领域,对于一些语言障碍患者,如失语症患者,了解他们在听觉 - 运动同步方面的问题,可能为制定个性化的康复治疗方案提供参考。
然而,该研究也存在一定的局限性。研究主要基于现有的实验数据进行分析,对于 P 中心在言语 - 言语同步中的具体作用机制尚未完全明确,未来需要通过更专门设计的实验进行深入探究。此外,研究样本数量相对有限,可能无法完全代表所有人群的情况。在后续研究中,可以扩大样本规模,涵盖不同年龄段、不同语言背景的人群,以提高研究结果的普遍性和适用性。
墨西哥国立自治大学 M. Florencia Assaneo 的这项研究为言语 - 言语同步领域的研究开辟了新的方向,尽管还有许多问题有待解决,但它为该领域的进一步发展奠定了坚实的基础,有望在未来推动相关领域取得更多突破性的成果。