探索亚词汇信息在言语感知与误感知中的作用

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Journal of Memory and Language》：Exploring the role of sublexical information in speech perception and misperception

【字体：大中小】 时间：2025年12月17日 来源：Journal of Memory and Language 3

编辑推荐：

　　语音退化中的感知增强机制研究。通过prime-probe范式，发现子词音系匹配（如韵律、辅音组合）可显著提升听者对退化语音的预测准确率，最高达74%。对比实验表明，词汇或语义匹配的贡献较小（提升约17%）。跨实验验证显示，即使prime为非词汇的子词匹配伪句子，仍能通过子词特征预测probe的真实内容。首次在连续退化语音句子中证实子词机制主导的感知增强，挑战传统模型忽视音系概率的局限。

　　
这篇研究系统探讨了听众如何利用语音学信息进行预测和误解，特别是在语音信号严重退化的情况下。通过七项实验，作者揭示了子词语音学信息（如音位组合和音韵模式）在驱动感知预 priming效应中的核心作用，挑战了传统认为词汇和语义信息是主要机制的模型。

### 研究背景与核心问题
人类在听到模糊或退化的语音信号时，会利用母语知识进行预测。传统模型（如Trace模型）认为这种预测基于词汇层面的信息，例如音位相似性（如“cat”与“cap”的声母匹配）。然而，当语音信号被光谱和时域双重退化处理（如使用Modulation Transfer Function技术）时，传统的词汇竞争模型可能无法解释听众如何快速恢复理解。关键问题在于：这种恢复依赖于词汇级信息，还是更基础的子词语音学信息？

### 实验设计与关键发现
#### 实验1：感知学习效应
作者使用144句高闭合概率的英文句子（如“James was running late”），通过光谱时域退化模拟严重听力损失场景。结果显示，听众对退化语音的识别率随暴露次数增加，从第一块（6%）逐步提升至第四块（12%）。但提升幅度远低于其他研究（如噪声语音编码实验中达80%），表明退化程度更高。

#### 实验2：探测-_prime-探测范式
引入三个条件：同构（prime与probe为同一句）、异构（prime与probe无关）、中性（prime与probe无关联）。结果发现，同构条件下的识别率高达95%，而异构和中性条件分别只有16%和8%。这验证了prime的语义关联性对恢复的重要性，但未明确信息层级。

#### 实验3-4：子词语音学信息的测试
作者构造了两种新型探测项：
1. **无意义音位匹配句**：如“the boy could fix the bike”退化后变为“the coy good mix the pike whiff tea head the height stools”，仅保留子词级语音学相似性（如“boy”与“coy”的辅音相似）。
2. **伪句子**：使用非词汇但符合音位概率的词（如“salfers”替代“surfers”），构建完全无意义的句子。

实验发现，在同等退化条件下，同构无意义句的识别率达70%，而伪句同构条件达74%，显著高于异构条件（5%-8%）。这说明听众能通过子词级信息（如音位组合）而非词汇或语义关联进行预测。

#### 实验5：直接对比真实与伪句子
将实验2和4的结果合并，比较听众对退化真实句与伪句的响应。结果显示，同构条件下真实句识别率（86%）与伪句（69%）接近，且均远高于异构条件（7%-3%）。这表明词汇信息并非必要，子词信息足以驱动恢复。

#### 实验6-7：反转prime-probe顺序
进一步验证子词信息的独立性：
- **实验6**：用无意义句作prime，退化真实句作probe。同构条件下识别率降至34%，但仍显著高于异构（6%）。
- **实验7**：用伪句作prime，退化真实句作probe。同构条件识别率提升至45%，证明子词信息能跨词汇类型传递。

### 理论突破与意义
1. **子词语音学信息的核心作用**：所有实验显示，当prime和probe在子词级（如音位组合、音韵模式）匹配时，听众能通过统计概率预测内容，即使完全缺乏词汇和语义关联。这支持了Vitevitch等人的子词概率模型，认为语言知识存储于音位组合的统计规律中。

2. **对传统模型的挑战**：
- **Trace模型**：强调词汇竞争，但无法解释为何无意义句仍能引发高识别率。
- **贝叶斯预测编码**：需纳入子词概率约束，传统模型未考虑这一层级的预测机制。

3. **退化语音的感知机制**：光谱时域退化严重削弱了音位和音节信息，但子词级模式（如双音节组合的概率）仍可被利用。这表明人类语音感知存在多层级编码，子词信息是底层恢复的基础。

### 局限性与未来方向
1. **局限性**：
- 样本量较小（30人/实验），可能影响统计效力。
- 未完全排除策略性响应（如重复prime词汇），但通过中性条件的控制，此可能性被降低。

2. **未来研究方向**：
- 探索子词信息的具体层级（如音位、音节、声调）的相对贡献。
- 比较不同退化技术（如MTF与噪声编码）对子词信息保留的影响。
- 研究多语言背景听众的子词信息利用差异。

### 结论
本研究首次证明，在严重退化的语音信号中，子词级语音学信息（如音位组合、音韵模式）是驱动听众预测和误解的核心机制。这为语音感知模型提供了新框架：底层子词信息通过统计概率形成预测基础，而词汇和语义信息在此基础上进行修正。该发现对人工智能语音识别系统设计（如提升噪声环境下的语音识别）具有指导意义，表明需优先建模子词概率规律。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号