多巴胺信号在小鼠巴甫洛夫条件退化任务中的关键作用:时间差分学习模型的新视角

【字体: 时间:2025年03月19日 来源:Nature Neuroscience 21.3

编辑推荐:

  为探究关联学习中偶然性与行为的神经机制,研究人员对小鼠开展相关研究,发现 TD 误差可描述偶然性和多巴胺能活动。

  关联学习依赖于偶然性,即一种刺激对结果的预测程度。尽管其很重要,但将偶然性与行为联系起来的神经机制仍不明确。在本研究中,研究人员在小鼠的巴甫洛夫条件退化任务中,检测了腹侧纹状体(ventral striatum)中的多巴胺活动,这一信号与关联学习有关。研究发现,当额外奖励在无提示情况下发放时,对条件刺激的预期舔舐和多巴胺反应均下降;但当额外奖励有提示时,二者则保持不变。这些结果与使用传统偶然性定义的基于偶然性的解释,以及新的因果学习模型(ANCCR)相矛盾,但可以用配备了适当的试次间间隔状态表征的时间差分(TD)学习模型来解释。在 TD 框架内训练的循环神经网络所形成的状态表征,类似于研究人员精心设计的最佳模型。研究结果表明,TD 误差可以作为一种衡量指标,用于描述偶然性和多巴胺能活动。<【多巴胺信号在小鼠巴甫洛夫条件退化任务中的关键作用:时间差分学习模型的新视角】
【为探究关联学习中偶然性与行为的神经机制,研究人员对小鼠开展相关研究,发现 TD 误差可描述偶然性和多巴胺能活动。】
【关联学习 | 多巴胺 | 腹侧纹状体 | 巴甫洛夫条件退化任务 | 时间差分(TD)学习模型 | 偶然性】
【未知】
【关联学习依赖于偶然性,即一种刺激对结果的预测程度。尽管其至关重要,但将偶然性与行为联系起来的神经机制依旧扑朔迷离。在本次研究中,科研人员在小鼠的巴甫洛夫条件退化任务里,对腹侧纹状体(ventral striatum)中与关联学习密切相关的多巴胺活动展开检测。结果显示,当额外奖励在无提示的情况下发放时,小鼠对条件刺激的预期舔舐行为以及多巴胺反应都会降低;然而,若额外奖励有提示,二者则不会发生变化。这些发现与基于传统偶然性定义的相关解释,还有新的因果学习模型(ANCCR)存在冲突。不过,配备了合适试次间间隔状态表征的时间差分(TD)学习模型却能对其作出合理说明。在 TD 框架下训练的循环神经网络所形成的状态表征,和科研人员精心构建的最佳模型极为相似。这一研究成果表明,TD 误差或许能作为一个衡量指标,用于刻画偶然性和多巴胺能活动。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号