-
生物通官微
陪你抓住生命科技
跳动的脉搏
试图理解“强迫症”的大脑运算逻辑
【字体: 大 中 小 】 时间:2022年09月01日 来源:Cell Reports
编辑推荐:
奈良科技研究所的研究人员利用一种行为模型来更好地理解强迫症的基础。他们表明,当强化和惩罚的学习参数极度不平衡时,执念和强迫之间的循环可以得到加强。这项工作可以帮助改善心理健康治疗。
来自奈良科学技术研究所(NAIST)、国际先进电信研究所和多马川大学的科学家们已经证明,强迫症(OCD)可以被理解为强化和惩罚之间学习不平衡的结果。在对他们的理论模型进行实证检验的基础上,他们表明,将当前结果与过去行为联系起来的大脑计算的不对称会导致行为紊乱。具体来说,这可能发生在对过去行为的记忆痕迹信号以不同的方式衰减为好和坏的结果时。在这种情况下,“好”意味着结果比预期的好,而“坏”意味着结果比预期的差。这项工作有助于解释强迫症是如何发展的。
强迫症是一种涉及焦虑的精神疾病,其特征是侵入性和重复性的思考,称为强迫,再加上某些重复的行为,称为强迫。强迫症患者经常感到无法改变行为,即使他们知道强迫或强迫是不合理的。在严重的情况下,这些可能会使人无法过正常的生活。过度洗手、出门时反复检查房门是否上锁等强迫行为,都是为了暂时缓解强迫症引起的焦虑。然而,到目前为止,人们对强迫和强迫的循环加强的手段还没有很好地了解。
现在,由NAIST的研究人员领导的一个团队使用强化学习理论来模拟与强迫症相关的无序循环。在这个框架中,比预期更好的结果变得更有可能(积极预测误差),而比预期更差的结果被抑制(消极预测误差)。在实施强化学习时,考虑延迟以及正/负预测误差也是很重要的。一般来说,经过一段时间的延迟,某个选择的结果是可以得到的。因此,应该在一定的时间范围内对最近的选择进行强化和惩罚。这被称为学分分配,在强化学习理论中被作为记忆痕迹来实现。理想情况下,对于正面和负面的预测错误,过去行为的记忆跟踪信号衰减的速度相等。然而,这在离散神经系统中不能完全实现。通过模拟,NAIST的科学家们发现,当与负预测错误有关的过去行为的记忆痕迹的痕迹衰减因子远小于与正预测错误相关的记忆痕迹衰减因子时,代理人会隐式学习强迫行为。这意味着,从相反的角度来看,对于负预测误差,对过去行为的看法要比对于正预测误差窄得多。“我们的模型,带有不平衡的痕迹衰减因子成功地代表了强迫症的执念和强迫特征的恶性循环”,共同第一作者Yuki Sakai和Yutaka Sakai说。
为了验证这一预测,研究人员让45名强迫症患者和168名健康的对照组玩了一个带有货币奖励和惩罚的电脑游戏。OCD患者则小得多,相比之下,正如OCD的计算特性所预测的那样。此外,这种不平衡的跟踪衰减因子设置被血清素增强剂正常化,这是治疗强迫症的一线药物。通讯作者Saori C. Tanaka说:“虽然我们认为我们总是做出理性的决定,但我们的计算模型证明,我们有时会含蓄地强化适应性不良的行为。”
虽然目前很难根据临床症状确定难治性患者,但该计算模型表明,具有高度不平衡的痕迹衰减因子的患者可能对单独的行为治疗没有反应。这些发现有一天可能被用来确定哪些患者在开始治疗前可能对行为疗法产生耐药性。
Memory trace imbalance in reinforcement and punishment systems can reinforce implicit choices leading to obsessive-compulsive behavior