对健康受试者鼻部电喉的声学分析
《Speech Communication》:An acoustic analysis of the nasal electrolarynx in healthy participants
【字体:
大
中
小
】
时间:2025年10月03日
来源:Speech Communication 3
编辑推荐:
鼻腔电子喉(NEL)的声学特性研究通过对比10名健康受试者的正常语音与NEL语音,发现NEL语音存在低频能量不足、第一和第二共振峰频率升高、鼻腔极振幅增强以及鼻音特征显著增加。基于声学编码和管模型理论分析,鼻腔传输路径改变了共振峰分布和鼻音效应,验证了理论模型的有效性。本研究为未来优化声学源和语音识别技术提供依据。
在现代医学与语言科学的交叉领域,一种名为鼻式电喉(Nasal Electrolarynx, NEL)的新型辅助发声装置正在引起广泛关注。该装置主要针对那些因声带缺失或需要气管切开术而无法正常发声的患者,提供了一种替代性的语音生成方式。与传统的电喉装置相比,NEL通过鼻腔作为声音传播的主要通道,改变了声音生成的路径,从而在使用体验和语音质量方面展现出一定的优势。然而,目前关于NEL语音的声学特性研究仍较为有限,因此本研究通过对比正常语音与NEL语音的声学表现,旨在揭示其独特的声学特征,为未来临床应用和语音识别技术的优化提供理论依据。
语音的生成是一个复杂的过程,通常包括三个基本组成部分:空气发生器、振动装置和发音器官。在正常情况下,空气由肺部提供,通过气管进入声带,声带的振动产生声波,而这些声波随后在口腔和鼻腔中被发音器官所塑造,最终形成可听的语音。然而,在某些特殊情况下,如喉切除术(laryngectomy)或气管切开术(tracheostomy),患者的声带功能受损或完全丧失,使得传统语音生成方式无法实现。为解决这一问题,医学界开发了多种辅助发声技术,包括传统的电喉、食管发声和气管-食管造瘘术(tracheoesophageal puncture, TEP)。其中,TSVoice作为一款新型的鼻式电喉,为喉切除术患者提供了更为便捷和自然的语音替代方案。
在语音生成的理论框架中,声源-滤波器理论(source-filter theory)是理解语音声学特性的关键。该理论认为,语音的生成源于声源与发音器官之间的相互作用。声源通常指气流通过声带或其他发声装置产生的振动,而发音器官则通过其形状和大小对声波进行过滤,形成特定的共振频率。在正常语音中,声带作为主要的声源,通过振动产生基频和一系列谐波,而这些声波在口腔和鼻腔中被进一步塑造,形成清晰的语音。然而,在使用NEL的情况下,声源位于鼻腔内部的电喉装置,其声音传播路径与传统语音有所不同,因此声学特性也存在差异。
本研究的参与者均为男性,年龄在20至30岁之间,平均年龄为25.8岁。所有参与者均为台湾普通话的母语者,并且具备基本的台湾闽南语能力。他们均未接受过头颈手术,也未患有声带结构异常或发音器官疾病。在实验当天,参与者均未出现声带感染或其他系统性疾病。研究采用了TSVoice这一鼻式电喉装置,其结构包括一个佩戴在头部的麦克风和一个内置微型扬声器的装置,扬声器通过鼻腔、鼻咽和咽腔将声音传递至口腔,最终从嘴唇发出。这种设计使得NEL在使用时无需手持操作,也无需特定的“甜点”位置,从而提高了其使用的便捷性和适用性。
通过分析参与者的语音信号,研究发现NEL语音在低频区域表现出能量缺失,而在高频区域则具有更高的能量分布。这与传统语音的声学特征形成鲜明对比。此外,NEL语音的共振频率(即形式音)整体上有所升高,尤其是在第一形式音(F1)和第二形式音(F2)方面。同时,研究还发现,NEL语音的鼻腔共鸣效果更为显著,鼻腔的共鸣幅度高于正常语音。这些发现表明,鼻式电喉在语音生成过程中,通过其独特的声学路径,不仅改变了形式音的分布,还增强了鼻腔共鸣的感知。
形式音的分布是语音声学研究中的一个重要指标,它反映了发音器官的共振特性。在正常语音中,形式音的分布通常较为集中,而在使用NEL的情况下,由于声波需要经过鼻腔和鼻咽,其形式音的分布发生了变化。研究通过线性预测编码(Linear Predictive Coding, LPC)分析了这种变化,并发现NEL语音的形式音整体上向高频方向偏移。这一现象可能与发音器官的结构变化有关,特别是在鼻腔和咽腔的共振特性上。同时,由于鼻腔在声波传播过程中的作用,鼻腔共鸣的增强也使得NEL语音在感知上更加清晰和自然。
鼻腔共鸣的增强是本研究的另一个重点。在正常语音中,声波主要在口腔中传播,而鼻腔则处于关闭状态,因此鼻腔共鸣相对较弱。然而,在使用NEL的情况下,声波必须经过鼻腔,使得鼻腔共鸣的强度增加。这一现象可能与发音器官的结构变化有关,尤其是在鼻腔和咽腔的共振特性上。研究还发现,NEL语音的鼻腔共鸣幅度高于正常语音,这表明鼻式电喉在语音生成过程中,通过其独特的声学路径,不仅改变了形式音的分布,还增强了鼻腔共鸣的感知。
本研究的结果表明,鼻式电喉在语音生成过程中展现出与正常语音不同的声学特征。这些特征包括低频能量缺失、形式音整体向高频方向偏移以及鼻腔共鸣的增强。这些发现不仅验证了发音器官的管模型理论和扰动理论,还为未来的研究提供了新的视角。通过进一步研究这些声学特征,可以更好地理解鼻式电喉在语音生成中的作用机制,从而为改进其设计和优化语音识别技术提供理论支持。
此外,本研究还强调了鼻式电喉在临床应用中的重要性。由于其独特的声学路径,鼻式电喉能够提供更为自然和清晰的语音,这对于喉切除术患者而言具有重要的意义。在传统语音生成方式中,患者需要通过气管切开术或气管-食管造瘘术来维持呼吸和发声功能,而这些方式往往伴随着一定的不便和风险。相比之下,鼻式电喉能够通过鼻腔作为声音传播的通道,使得患者在使用过程中更加自由,也减少了对呼吸功能的依赖。这种设计使得鼻式电喉在临床应用中具有更高的可行性和适用性。
在实验过程中,研究人员采用了多种方法和技术来确保数据的准确性和可靠性。其中包括使用LPC分析来评估语音信号的频率分布,以及通过测量鼻腔共鸣的强度来评估其对语音感知的影响。这些方法的结合使得研究人员能够全面地分析鼻式电喉的声学特性,并与正常语音进行对比。此外,研究人员还对参与者进行了严格的筛选,确保他们的语音能力符合实验要求,并且在实验过程中保持良好的健康状况。
本研究的发现不仅为鼻式电喉的临床应用提供了理论支持,也为未来的研究提供了新的方向。通过进一步研究鼻式电喉的声学特性,可以更好地理解其在语音生成中的作用机制,从而为改进其设计和优化语音识别技术提供理论依据。此外,这些发现还可以为其他辅助发声技术的研究提供参考,促进相关领域的技术进步和临床应用。
在未来的临床应用中,鼻式电喉的声学特性可能对语音识别系统的优化产生重要影响。由于其独特的声学路径,鼻式电喉的语音信号可能具有特定的频率分布和共振特性,这可能会影响语音识别系统的准确性。因此,研究这些声学特性不仅有助于改进鼻式电喉的设计,还可能为语音识别技术的优化提供新的思路。此外,鼻式电喉的声学特性也可能对语音治疗和康复训练产生影响,特别是在针对喉切除术患者的语音训练中。
本研究的成果表明,鼻式电喉在语音生成过程中具有独特的声学特征,这些特征可能对未来的临床应用和语音识别技术产生重要影响。通过进一步研究这些声学特征,可以更好地理解鼻式电喉在语音生成中的作用机制,从而为改进其设计和优化语音识别技术提供理论支持。此外,这些发现还可以为其他辅助发声技术的研究提供参考,促进相关领域的技术进步和临床应用。因此,鼻式电喉的研究不仅具有重要的科学价值,也具有重要的临床意义。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号