在卷积神经网络中调节隐性注意力的新兴神经机制

《Proceedings of the National Academy of Sciences》:Emergent neuronal mechanisms mediating covert attention in convolutional neural networks

【字体: 时间:2025年11月15日 来源:Proceedings of the National Academy of Sciences 9.4

编辑推荐:

  隐蔽注意的神经计算机制与生物模型比较。通过训练CNN处理Posner注意任务,发现其自然涌现隐蔽注意行为特征。分析表明,CNN深层通过位置整合、抑制及求和等计算机制实现目标检测,与小鼠上丘脑神经元实验数据部分吻合,验证了生物启发计算模型的有效性,并预测了新型神经元类型。

  本文探讨了卷积神经网络(CNN)在没有显式注意力机制的情况下,是否能展现出与生物视觉系统类似的隐式注意力特征。隐式视觉注意力是指在不移动眼睛的情况下选择图像或场景中的某个位置,这种机制在目标检测、辨别和搜索任务中对感知表现有显著提升。实验表明,当目标出现在被提示的位置(有效提示任务)时,受试者的反应速度和准确性通常优于目标出现在未提示位置(无效提示任务)的情况。为了更深入地理解这些现象,本文对CNN的多阶段处理过程进行了系统分析,试图揭示这些网络在处理信息时如何表现出类似生物大脑的计算机制,并进一步与小鼠的上丘(SC)神经元特性进行了对比研究。

在实验设计中,CNN被训练以检测图像中是否存在目标(倾斜的线),而图像中包含独立的高斯亮度噪声。在有效提示条件下,提示(一个围绕其中一条线的框)有80%的概率与目标共存,而在无效提示条件下,提示与目标位置相反。值得注意的是,CNN在训练过程中并未使用人类的反应数据,因此其注意力效果并非通过拟合人类数据获得,而是由网络自身在处理信息时所表现出的统计特性驱动。此外,实验还展示了CNN在不同任务和网络结构下,其注意力机制的普遍性与可扩展性,包括对不同类型的提示、噪声水平、网络层数和卷积核大小的适应能力。

为了评估CNN的注意力机制,研究采用了经典的神经科学方法,如接收者操作特征(ROC)曲线和反卷积方法。这些方法被用来量化每个网络单元(即神经元)对目标、提示和位置信息的敏感性。通过对180,000个神经元的分析,研究发现,随着网络处理层级的加深,目标敏感性与提示敏感性均呈现出显著的变化趋势。例如,在早期的卷积层中,神经元对目标和提示的敏感性较低,而在更深层的网络中,这些敏感性显著增强。此外,研究还发现,CNN中存在多种类型的神经元,包括仅对目标敏感的神经元、仅对提示敏感的神经元,以及同时对目标和提示敏感的神经元(即TC神经元)。这些神经元在不同层级中的比例变化表明,CNN在不同处理阶段表现出不同的注意力机制。

在CNN的深层结构中,特别是扁平层(flat layer)和密集层(dense layer),神经元不仅对目标和提示信息敏感,还表现出跨位置整合的能力。这意味着,这些神经元能够同时处理来自两个位置的信息,并根据提示的存在与否调整其响应。在密集层中,神经元的敏感性不仅体现在目标检测上,还体现在提示信息的整合中,表现出与生物视觉系统相似的计算特征。研究还发现,CNN中存在特定的神经元类型,如位置总和神经元(location-summation neurons)和位置对抗神经元(location-opponent neurons),这些神经元的特性在生物神经元中也有类似表现,例如在小鼠SC中观察到的对抗神经元。然而,CNN还预测了一些生物神经元中未被报道的特性,如位置总和与对抗结合的神经元(location summation + opponent neurons),这可能为理解生物大脑中更复杂的注意力机制提供新的视角。

通过将CNN的预测结果与小鼠SC神经元的实验数据进行对比,研究发现,尽管CNN和SC神经元在某些方面表现出相似的特性,如目标和提示的敏感性,但在其他方面也存在差异。例如,CNN中存在更多的位置总和和对抗神经元,而这些类型在SC中较为少见。此外,CNN的注意力效果更广泛地分布在不同层级,而SC神经元的注意力效应则更多地集中在特定的区域。这表明,CNN在模拟生物视觉系统时,能够捕捉到一些关键的计算特性,同时也揭示了生物系统中尚未被充分理解的机制。

研究还探讨了CNN中注意力机制的形成过程,即如何通过网络的层级处理实现目标检测的优化。结果表明,CNN中的注意力效应并非由单一的机制驱动,而是由多种机制共同作用,包括位置总和、对抗和与ReLU激活函数的交互等。这些机制在不同层级中的表现差异,反映了CNN在处理信息时的复杂性。例如,在早期卷积层中,神经元主要对单个位置的目标和提示信息敏感,而在更深层的网络中,神经元则表现出跨位置整合的能力,并对提示信息的权重进行调整,从而提升目标检测的准确性。

从系统层面来看,CNN的处理机制与理想贝叶斯观察者(BIO)模型具有一定的对应关系。BIO模型通常被用来评估生物系统如何处理视觉信息,并作为视觉搜索和注意力的基准模型。研究发现,CNN在不同层级中的处理特性与BIO模型的各个阶段相匹配,尤其是在目标-提示整合和位置整合阶段。然而,与BIO模型不同的是,CNN的注意力机制更加多样化,表现出不同的整合程度和类型,这可能与生物大脑中更为复杂的神经网络结构有关。

此外,研究还指出,CNN的注意力机制在某种程度上可以解释一些已知的生物神经机制。例如,单个位置的TC神经元表现出类似于V4区域神经元的特性,即在整合信息之前,它们对目标敏感性的变化由提示信息驱动。而位置总和和对抗神经元则与SC和LIP区域的神经元特性更为相似,表明这些机制可能在生物系统中存在,但尚未被广泛研究。研究还发现,CNN中某些神经元的敏感性变化与提示的有效性密切相关,这与EEG研究中观察到的注意力效应变化趋势一致。

从更广泛的角度来看,本文的研究成果不仅为理解生物视觉系统中的注意力机制提供了新的思路,还为计算模型在模拟生物感知过程中的应用提供了理论支持。传统的注意力研究多基于行为实验和神经电生理记录,而本文通过将CNN与神经科学方法相结合,揭示了网络中注意力效应的潜在机制,并展示了这些机制如何与生物系统的特性相对应。这种跨学科的方法有助于更全面地理解注意力的计算基础,并为未来的研究提供了新的方向。

综上所述,本文通过训练CNN并分析其在处理视觉任务时的注意力特性,揭示了CNN中可能存在的注意力机制。这些机制包括单个位置的TC神经元、位置总和神经元、位置对抗神经元以及它们的组合形式。通过与小鼠SC神经元的实验数据进行对比,研究发现CNN能够模拟生物视觉系统中的一些关键特性,同时也预测了一些尚未被研究的神经元类型。这些发现不仅加深了我们对注意力机制的理解,还为计算模型在模拟生物感知过程中的应用提供了新的视角。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号