内侧前额叶皮层在基于奖赏历史的决策中优先编码环境变化需求:引领背内侧纹状体的时序动力学研究
《iScience》:Medial prefrontal cortex activity precedes dorsomedial striatum in need for change during history-based flexible behavior
【字体:
大
中
小
】
时间:2025年11月14日
来源:iScience 4.1
编辑推荐:
本研究针对认知灵活性神经机制中前额叶-纹状体环路分工的争议,通过头固定小鼠动态觅食任务结合在体电生理记录,发现内侧前额叶皮层(mPFC)比背内侧纹状体(DMS)更早、更快地编码奖赏历史差异信号(PRPD),光遗传干扰mPFC表征会损害决策适应,且mPFC-DMS功能连接在奖赏稀缺时增强,揭示了mPFC作为环境变化"第一响应器"通过增强皮层-纹状体通讯指导适应性行为的新机制。
在瞬息万变的环境中,生物体如何快速调整行为策略以适应新情况,是一个关乎生存的重要科学问题。这种被称为认知灵活性的能力,当其出现功能障碍时,会成为多种精神疾病和神经退行性疾病的核心特征。大脑内的内侧前额叶皮层(medial prefrontal cortex, mPFC)和背内侧纹状体(dorsomedial striatum, DMS)被认为是实现认知灵活性的两个关键脑区,但这两个区域究竟如何协作?当环境发生变化时,是哪个区域首先检测到这些变化并发出"需要改变"的信号?这一直是神经科学领域争论的焦点。
有两种竞争性假说试图解释这一过程。一种假说认为纹状体特别是DMS充当"环境检测器",由于其解剖位置作为连接皮层和皮下结构的枢纽,以及其中等棘神经元高度集中的输入特性,使其特别适合通过强化学习相关的可塑性来学习环境变化。根据这一模型,在环境切换期间,纹状体活动应该先于前额叶活动。相反,第二种假说则认为mPFC负责检测环境变化,而纹状体则负责从多个已学习反应中进行选择,预测mPFC活动在灵活行为期间应该先于纹状体活动。
为了解决这一争议,爱丁堡大学的研究团队在《iScience》上发表了一项研究,他们开发了一种头固定小鼠的动态觅食范式,让小鼠通过向左或向右转动方向盘来获取液体奖励,但两个方向的奖励概率并不相等,且会在一个会话中多次无声切换。研究人员同时使用高密度硅电极记录mPFC和DMS的神经元活动,结合光遗传学干预技术,深入探究了这两个脑区在基于行动-结果历史的灵活行为中的神经动力学机制。
研究团队采用了多项关键技术:头固定小鼠动态觅食行为范式、双脑区在体多通道电生理记录、神经元分类鉴定、光遗传学特异性通路干预、尖峰时序相位分析、神经元对功能连接强度计算,以及强化学习建模分析。这些方法的综合运用使得研究人员能够以前所未有的时空精度解析mPFC-DMS环路的动态交互。
动态觅食任务中mPFC和DMS神经元编码感知奖赏概率差异
研究人员首先量化描述了小鼠在动态觅食任务中的行为表现。任务中,小鼠需要根据不断变化的奖励概率做出选择,高奖励概率侧和低奖励概率侧会在一个会话中发生多次切换(平均每个会话3.8±1.1个区块)。小鼠在任务中表现出良好的学习能力,在概率切换后约30次试验内适应新的奖励规则。
通过分析mPFC和DMS的神经元活动,研究发现两个脑区中均有大量神经元编码感知奖赏概率差异(perceived reward probability difference, PRPD),这一决策变量能够解释动物的选择偏好。在mPFC中,无论是 putative pyramidal neurons(pPNs)还是 putative interneurons(pINs),都有约一半的神经元在 inter-trial interval(ITI)或 response time window(RTW)期间表现出与PRPD相关的调制活动。类似地,在DMS中,medium spiny neurons(MSNs)和 fast-spiking interneurons(FSs)也有超过一半的神经元显示PRPD调制。这表明两个脑区都参与了奖赏历史信息的表征。
mPFC尖峰调制在响应变化奖赏概率差异时领先于DMS
研究的关键发现在于mPFC和DMS神经元活动的时间关系。通过分析整个会话中mPFC-DMS神经元对的 trial-wise 尖峰调制相位差,研究人员发现mPFC神经元的相位显著领先于DMS神经元。这种"mPFC领先,DMS滞后"的模式在行为表现良好的会话中尤为明显,而在表现较差的会话中则缺乏这种不对称性,表明这种时序协调关系对于成功执行灵活行为至关重要。
研究人员进一步探讨了mPFC和DMS之间信息传递强度的动态变化。通过分析 spike-to-spike 交叉相关性,发现mPFC-DMS神经元对的功能连接强度与整体 prior reward proportion(PRP)呈负相关,即在奖赏经验较低的时期,两个脑区之间的连接强度增强。这一现象在 putative monosynaptic excitatory(PMSE)配对中同样存在,表明在 monosynaptic 水平上,mPFC到DMS的信息传递在奖赏稀缺时也得到增强。
mPFC和DMS尖峰活动差异性地表征整体奖赏历史信息
通过多线性回归分析,研究人员比较了mPFC和DMS神经元对不同任务模态(信号、运动、奖赏)的表征如何受奖赏历史影响。结果显示,mPFC神经元对奖赏的表征显著受到 prior reward proportion 的影响,而DMS神经元的奖赏表征则相对不受历史奖赏经验的影响。这表明mPFC尖峰活动对奖赏历史信息更为敏感,可能充当了奖赏经历的"工作记忆"。
时间靶向光遗传干扰mPFC中PRPD调制放电损害觅食行为适应
最后,研究团队通过光遗传学方法验证了mPFC到DMS投射的功能必要性。他们特异性在DMS投射的mPFC神经元中表达 channelrhodopsin 2(ChR2),并在ITI或RTW期间进行时间靶向的光遗传干扰。结果显示,非选择性地全局激活DMS投射的mPFC神经元会显著损害行为适应,增加反应时间、未响应试验比例,并降低优势选择比例。这种干扰在ITI期间尤为明显,表明mPFC皮质纹状体神经元在维持和更新决策变量(PRPD)中的必要性。
这项研究系统地阐明了mPFC和DMS在基于奖赏历史的灵活行为中的协同作用。研究结果支持mPFC作为"环境变化检测器"的假说,表明在需要学习抽象推断信息(如历史)的任务中,mPFC会比DMS更早地表征环境变化。更重要的是,研究揭示了mPFC和DMS之间功能连接的动态特性,这种连接在奖赏稀缺时增强,可能通过 dopamine 介导的 reward prediction error 信号机制实现。
研究的创新之处在于首次在细胞水平上提供了具有明确解剖特异性的实时、跨脑区尖峰传递证据,揭示了mPFC-DMS环路在实现灵活行为中的动态协作机制。这些发现不仅增进了我们对认知灵活性神经基础的理解,也为相关精神疾病(如强迫症、成瘾等)的环路水平病理机制提供了重要线索。未来研究可以在此基础上进一步探索在更自然istic 环境中这些环路的运作机制,以及它们在各种神经精神疾病中的特异性改变。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号