猕猴内侧前额叶皮层同时表征自我与他人奖励预测误差：解锁社交学习的神经密码

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年03月03日 来源：Cell Reports 7.5

编辑推荐：

　　为探究大脑能否同时计算自我（S-RPE）和他人（O-RPE）的奖励预测误差，研究人员训练猴子，发现猕猴背内侧前额叶神经元可同时表征 S-RPE 和 O-RPE，这有助于理解大脑从他人视角理解环境因果结构的神经机制。

娑撹桨绨℃穱鍐箻缁夋垵顒熼惃鍕炊閹绢叏绱濋悽鐔哄⒖闁岸鍣伴梿鍡曠啊鏉╂瑧鐦掗弬鍥╃彿閿涘苯顩ч棁鈧懟杈ㄦ瀮閸樼喐鏋冮敍宀冾嚞閻愮懓鍤敍锟�鐠併垽妲凚ioHot缁便垹褰囬崢鐔告瀮

　　在我们生活的社交世界里，每个人对环境刺激的价值判断都不一样。为了理解他人眼中的世界，我们需要了解他们经历的奖惩，这种能力被称为心理理论（mentalizing 或 theory of mind）。在这个过程中，他人奖励预测误差（O-RPE，即预测的他人奖励与实际观察到的奖励之间的差异）和自我奖励预测误差（S-RPE，通过个人直接经验学习的主要计算变量）起着重要作用。

以往研究发现，S-RPE 的神经特征多存在于富含多巴胺的皮层下区域，而 O-RPE 的神经特征与大脑皮层活动有关，特别是腹内侧前额叶皮层和后扣带皮层区域。但仍有许多关键问题未解决。比如，大脑能否在不同个体学习不同刺激 - 结果关联时，同时计算 O-RPE 和 S-RPE？O-RPE 在单神经元水平的编码机制是怎样的？O-RPE 是否在心理理论网络的皮层区域（如背内侧前额叶皮层 DMPFC）有所表征？

为了解开这些谜团，来自日本国立生理科学研究所、综合研究大学院大学、关西医科大学的 Atsushi Noritake 和 Masaki Isoda 等研究人员开展了深入研究，相关成果发表在《Cell Reports》上。

研究人员主要采用了以下关键技术方法：

行为实验：训练两只猕猴进行社交巴甫洛夫条件反射实验。在实验中，两只猴子面对面坐，每次试验会呈现视觉刺激，之后会根据不同规则给其中一只猴子奖励（水），模拟自然界的资源竞争。
神经元记录：利用钨电极记录猕猴 DMPFC 的单神经元活动，获取神经元在不同刺激和奖励条件下的反应数据。
数据分析：通过定义不同类型的神经元编码标准，运用统计分析和机器学习方法，判断神经元是否编码 O-RPE、S-RPE 等，并评估其解码 RPE 信号的能力。

楠炲灝鎲� 【大小鼠常见临床症状】最新指南一键下载

研究结果如下：

DMPFC 神经元编码正 O-RPE：研究人员通过设定特定标准，在 DMPFC 中识别出 22 个编码正 O-RPE 的神经元。这些神经元在 O 获得奖励时，活动水平与 O-RPE 显著相关，且在不同刺激条件下反应不同，证明其能阶段性编码正 O-RPE。
DMPFC 神经元编码负 O-RPE：同样依据标准，发现 38 个神经元编码负 O-RPE。这些神经元在 O 未获得奖励时，活动水平与负 O-RPE 显著相关，且与编码正 O-RPE 的神经元群体不同，表明 DMPFC 存在专门编码负 O-RPE 的神经元。
DMPFC 神经元编码 O 奖励结果：有 35 个神经元编码观察到的 O 奖励结果，其中部分神经元在 O 获得奖励时活动水平高，部分则相反。这些神经元为计算 O-RPE 提供了关键信息。
DMPFC 神经元编码正 S-RPE：研究人员找到 6 个编码正 S-RPE 的神经元，这些神经元在 O 未获得奖励时，活动水平与正 S-RPE 在 S 块和 O 块均显著相关，且不编码负 S-RPE，具有特异性。
DMPFC 神经元编码负 S-RPE：确定了 12 个编码负 S-RPE 的神经元，它们在 O 获得奖励时，活动水平与负 S-RPE 在 S 块显著相关，在 O 块活动无显著差异，且不编码正 S-RPE。
各类神经元数量的意义：通过随机重分配 RPE 值生成混洗数据集进行统计分析，发现编码正 O-RPE、负 O-RPE、正 S-RPE 和负 S-RPE 的神经元数量均显著高于随机水平，且各类型神经元形成不同群体。
RPE 信号的解码：利用机器学习的决策树分类器评估 RPE 编码神经元传递信息的准确性，发现编码 O-RPE 的神经元解码准确率显著高于随机水平，而编码 S-RPE 的神经元解码准确率接近随机水平，表明 DMPFC 中部分神经元能可靠传递 O-RPE 信息。

研究结论和讨论：
本次研究首次直接证明了 DMPFC 中的单神经元能编码他人特异性的 RPE，这是对大脑在社交情境中处理 RPE 机制理解的重要突破。研究发现编码 O-RPE 的神经元数量多于编码 S-RPE 的神经元，这可能与任务设计中奖励先给予他人有关，也提示 DMPFC 在处理他人相关信息中起重要作用。此外，DMPFC 神经元除了编码 RPE，还编码其他奖励相关信号，这些信号共同作用，帮助个体从他人视角理解和适应世界，对心理理论的神经机制研究有重要意义。

不过，该研究也存在一些局限性。例如，神经元记录是在学习完成后进行的，无法明确 DMPFC 中 RPE 信号在学习过程中的发展情况；同时，RPE 编码神经元在非社交情境下的活动变化也不清楚，且前扣带回皮层（ACC）中的单神经元是否也能同时编码 S-RPE 和 O-RPE，以及与 DMPFC 的功能差异也有待进一步研究。但总体而言，这项研究为我们理解大脑在社交情境下的学习和决策机制提供了关键线索，为后续研究奠定了重要基础。

娑撳娴囩€瑰宓庢导锔炬暩鐎涙劒鍔熼妴濠団偓姘崇箖缂佸棜鍎禒锝堥樋閹活厾銇氶弬鎵畱閼筋垳澧块棃鍓佸仯閵嗗甯扮槐銏狀洤娴ｆ洟鈧俺绻冩禒锝堥樋閸掑棙鐎芥穱鍐箻閹劎娈戦懡顖滃⒖閸欐垹骞囬惍鏃傗敀

10x Genomics閺傛澘鎼isium HD 瀵偓閸氼垰宕熺紒鍡氬劒閸掑棜椴搁悳鍥╂畱閸忋劏娴嗚ぐ鏇犵矋缁屾椽妫块崚鍡樼€介敍锟�

濞嗐垼绻嬫稉瀣祰Twist閵嗗﹣绗夐弬顓炲綁閸栨牜娈慍RISPR缁涙盯鈧鐗哥仦鈧妴瀣暩鐎涙劒鍔�

閸楁洜绮忛懗鐐寸ゴ鎼村繐鍙嗛梻銊ャ亣鐠佹彃鐖� - 濞ｅ崬鍙嗘禍鍡毿掓禒搴ｎ儑娑撯偓娑擃亜宕熺紒鍡氬劒鐎圭偤鐛欑拋鎹愵吀閸掔増鏆熼幑顔垮窛閹貉傜瑢閸欘垵顫嬮崠鏍掗弸锟�

娑撳娴囬妴濠勭矎閼崇偛鍞撮摂瀣鐠愩劋绨版担婊冨瀻閺嬫劖鏌熷▔鏇犳暩鐎涙劒鍔熼妴锟�