编辑推荐:
视觉感知学习(VPL)机制不明,存在多种相互冲突的神经模型。研究人员开展基于神经几何方法的 VPL 研究,发现神经流形收缩是 VPL 的主要机制。该研究统一了 VPL 现有发现,为理解其神经机制提供新视角。
在神秘而复杂的大脑世界里,视觉感知学习(Visual Perceptual Learning,VPL)如同一个隐藏着无数奥秘的宝藏,吸引着众多科研人员不断探索。VPL 指的是因视觉经验而带来的长期行为表现提升,这一能力对生物在环境中的生存至关重要。然而,尽管多年来,系统神经科学、心理物理学和机器学习等领域的研究者们从不同角度对其进行钻研,但 VPL 背后的神经机制却依旧扑朔迷离。
此前的研究提出了多种关于 VPL 的神经模型,其中较为典型的是神经元调谐曲线变化模型和噪声相关性变化模型。前者认为 VPL 与神经元调谐曲线的变化有关,就像猴子视觉皮层中方向调谐曲线的锐化现象;后者则主张 VPL 源于神经元放电率的逐次试验共变(即噪声相关性)的降低,在猴子和鸣禽的研究中都观察到了这一现象。但这些模型都是基于单一单元层面提出的,而 VPL 中这些机制的效果应在群体层面评估,且单一单元响应的变化究竟是群体表征改善的真正原因,还是仅仅是副产品,目前仍存在争议。此外,不同方面的单一单元响应(如调谐曲线和噪声相关性)之间存在复杂的相互作用,其相互作用在训练过程中并非一成不变,而是动态变化的,这进一步增加了理解训练如何影响它们相互作用的难度。因此,迫切需要一种全面的计算方法来量化和理清这些变化对神经群体表征的影响。
为了揭开 VPL 的神秘面纱,上海交通大学医学院附属精神卫生中心、上海交通大学心理学院等研究机构的研究人员开展了一项极具创新性的研究。他们提出了一种神经几何方法,将单一单元的所有神经变化概念化为高维神经空间中群体响应流形的几何变换。通过理论建模和实证测试,研究发现神经流形收缩(由逐次试验群体响应变异性降低引起)而非调谐或相关性变化,才是 VPL 的主要机制。这一研究成果发表在《Nature Human Behaviour》上,为深入理解 VPL 的神经机制开辟了新的道路。
研究人员主要运用了以下关键技术方法:一是深度卷积神经网络(DCNN)建模,分别对方向辨别学习和运动方向辨别学习任务进行训练,以模拟 VPL 过程;二是人类功能磁共振成像(fMRI)实验,对参与运动方向辨别学习任务训练的人类受试者进行扫描,分析大脑活动;三是猴子多单元记录实验,记录猴子在对比辨别学习任务训练过程中 V4 神经元的群体响应 。
研究结果如下:
- VPL 提高 DCNN 的行为表现:在方向辨别任务中,训练几乎在所有刺激对比度和噪声条件下都提升了 DCNN 的网络性能,其阈值与噪声(TvN)函数均匀下移,这与人类心理物理学结果一致。
- VPL 优化 DCNN 中的神经群体表征:通过多元解码分析和计算线性 Fisher 信息,发现训练显著提高了 DCNN 后期层的解码准确性和所代表的感官信息量,表明训练优化了群体层面的刺激表征。
- VPL 改变 DCNN 中单个单元的响应属性:训练使 DCNN 中人工神经元出现了 VPL 的三个关键个体层面神经特征,即调谐曲线适度锐化、Fano 因子降低(表明单个神经元响应的信噪比增加)、试验间噪声相关性降低,并且噪声相关性的降低依赖于调谐相似性。
- 四种机制与 VPL 的神经几何方法:研究提出 VPL 存在四种可能的机制,即信号增强、流形收缩、信号旋转和流形扭曲。分析发现,信号增强在所有五层中对刺激信息的提升作用最小,甚至在第一层和第二层中降低了刺激信息;流形收缩在几乎所有层中都增强了刺激信息;信号旋转在考虑流形扭曲之前似乎增强了刺激信息,但考虑之后效果减弱;流形扭曲则改变了高维神经流形的形状 。
- 运动方向辨别学习在 DCNN 中的研究:在运动方向辨别学习任务中,DCNN 同样出现了类似机制,训练提高了网络的行为表现、解码准确性和平均线性 Fisher 信息,降低了 Fano 因子和噪声相关性,未显著改善信号分离但明显降低了响应方差,还诱导了信号旋转和流形扭曲 。
- 运动方向辨别学习在人类大脑中的研究:对人类受试者进行运动方向辨别学习任务训练前后的 fMRI 数据分析,发现训练显著提高了解码准确性和平均线性 Fisher 信息,未增加信号分离但显著降低了体素响应方差和体素间相关性,信号旋转机制也很明显,且训练使协方差的大小和方向发生了扭曲,四种机制的各自贡献与 DCNN 中的模式相似 。
- 对比辨别学习在猴子 V4 中的研究:对两只猴子在对比辨别学习任务训练过程中 V4 神经元的群体响应进行分析,发现训练显著提高了行为表现和群体层面的刺激信息,降低了 Fano 因子、噪声相关性和试验间方差,未明显改变信号分离,同样观察到了信号旋转和流形扭曲的证据 。
研究结论和讨论部分指出,虽然训练后调谐曲线和噪声相关性有明显变化,但它们对 VPL 相关的群体表征改善贡献并不显著,而此前被忽视的机制 —— 单个单元的响应方差(即流形收缩),才是 VPL 相关群体表征改善的主要贡献者。这一发现对限制 VPL 模型具有重要意义,明确了流形收缩是全局群体响应的标志,与单个单元的逐次试验变异性变化不同。同时,该研究的神经几何方法将高维信号检测理论扩展为神经几何,统一了 VPL 的重要现有发现,为未来研究 VPL 的泛化能力、感知后果以及神经基础提供了理论框架。不过,该研究也存在一些局限性,如 DCNN 与生物视觉系统存在差异、无法解释无监督训练和纯心理意象的学习机制、未研究学习效果对未训练刺激的泛化等,为后续研究指明了方向。