多巴胺信号在小鼠巴甫洛夫条件退化任务中的关键作用:时间差分学习模型的新视角
【字体:
大
中
小
】
时间:2025年03月19日
来源:Nature Neuroscience 21.3
编辑推荐:
为探究关联学习中偶然性与行为的神经机制,研究人员对小鼠开展相关研究,发现 TD 误差可描述偶然性和多巴胺能活动。
关联学习依赖于偶然性,即一种刺激对结果的预测程度。尽管其很重要,但将偶然性与行为联系起来的神经机制仍不明确。在本研究中,研究人员在小鼠的巴甫洛夫条件退化任务中,检测了腹侧纹状体(ventral striatum)中的多巴胺活动,这一信号与关联学习有关。研究发现,当额外奖励在无提示情况下发放时,对条件刺激的预期舔舐和多巴胺反应均下降;但当额外奖励有提示时,二者则保持不变。这些结果与使用传统偶然性定义的基于偶然性的解释,以及新的因果学习模型(ANCCR)相矛盾,但可以用配备了适当的试次间间隔状态表征的时间差分(TD)学习模型来解释。在 TD 框架内训练的循环神经网络所形成的状态表征,类似于研究人员精心设计的最佳模型。研究结果表明,TD 误差可以作为一种衡量指标,用于描述偶然性和多巴胺能活动。<【多巴胺信号在小鼠巴甫洛夫条件退化任务中的关键作用:时间差分学习模型的新视角】
【为探究关联学习中偶然性与行为的神经机制,研究人员对小鼠开展相关研究,发现 TD 误差可描述偶然性和多巴胺能活动。】
【关联学习 | 多巴胺 | 腹侧纹状体 | 巴甫洛夫条件退化任务 | 时间差分(TD)学习模型 | 偶然性】
【未知】
【关联学习依赖于偶然性,即一种刺激对结果的预测程度。尽管其至关重要,但将偶然性与行为联系起来的神经机制依旧扑朔迷离。在本次研究中,科研人员在小鼠的巴甫洛夫条件退化任务里,对腹侧纹状体(ventral striatum)中与关联学习密切相关的多巴胺活动展开检测。结果显示,当额外奖励在无提示的情况下发放时,小鼠对条件刺激的预期舔舐行为以及多巴胺反应都会降低;然而,若额外奖励有提示,二者则不会发生变化。这些发现与基于传统偶然性定义的相关解释,还有新的因果学习模型(ANCCR)存在冲突。不过,配备了合适试次间间隔状态表征的时间差分(TD)学习模型却能对其作出合理说明。在 TD 框架下训练的循环神经网络所形成的状态表征,和科研人员精心构建的最佳模型极为相似。这一研究成果表明,TD 误差或许能作为一个衡量指标,用于刻画偶然性和多巴胺能活动。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号