用 CNN 模型模拟视觉系统疾病:解锁神经退行性疾病奥秘的新钥匙

【字体: 时间:2025年02月20日 来源:Scientific Reports 3.8

编辑推荐:

  为解决以往模拟神经退行性疾病不真实的问题,研究人员开展用 CNN 模型模拟视觉系统疾病的研究。结果显示模型能模拟疾病进展中的认知变化。该研究有助于理解疾病机制,推动相关康复治疗发展,值得科研读者一读。

  
在科技飞速发展的今天,人工智能与神经科学的交叉领域就像一座神秘的宝藏,吸引着众多科研人员前去探索。其中,卷积神经网络(CNNs)作为人工智能领域的 “明星选手”,因其在计算机视觉任务中的出色表现,与哺乳动物视觉系统在架构和信息处理上有着许多相似之处,成为了研究人员关注的焦点。

以往的研究中,虽然已经发现可以用 CNNs 来模拟大脑的一些功能,甚至尝试模拟神经退行性疾病带来的影响,但仍存在不少问题。比如,之前模拟神经退行性疾病时,常常简单地将突触和神经元从训练好的 CNNs 中直接移除,这种方法过于 “粗暴”,和真实的生物过程相差甚远。就好比在现实世界里,疾病不会突然让某个细胞或连接瞬间消失,而是有一个逐渐发展的过程。以 tau 蛋白积累为例,在大脑中,tau 蛋白异常聚集(tau 蛋白异常聚集会形成神经纤维缠结,干扰神经元正常功能,导致神经退行性疾病的发生和发展 )的过程是缓慢且持续的,会逐渐影响神经传递,最终才导致突触死亡,而不是一下子就出现突触消失的情况。所以,这种不真实的模拟方式,让研究结果难以准确反映疾病的真实发展情况。

为了解开这些谜团,探索更接近真实的神经退行性疾病发展过程,[第一作者单位] 的研究人员踏上了探索之旅。他们的研究成果发表在了《期刊原文名称》上,论文题目是《论文原文标题》。经过一系列深入研究,他们得出了不少重要结论,这对我们理解神经退行性疾病的发展机制,以及开发针对性的治疗方法有着重要意义。

在这项研究中,研究人员运用了几个关键技术方法。首先,他们采用了一种类似 VGG19 的架构,这是一种和人类大脑相似度较高的 CNNs 架构。为了避免模型过度参数化带来的干扰,他们还对其进行了压缩处理。其次,在模拟神经退行性疾病时,他们不再简单地移除突触,而是让突触以一种动态的方式逐渐衰减,同时还会对未受影响的突触进行重新训练。另外,为了评估模型内部表示的相似性,他们使用了中心核对齐(CKA)技术;为了深入分析特定层的特征表示,还运用了主成分分析(PCA)这种无监督技术。

下面,让我们一起来看看他们的研究结果。

作为认知功能下降指标的物体识别准确率降低


研究人员对模型进行了 10 次突触衰减和重新训练的迭代实验。他们选用了一个常用的计算机视觉数据集 CIFAR10,这个数据集里有 10 类自然图像,就像一个小小的图像 “百宝箱”。一开始,健康的压缩 VGG19 CNN 模型在这个数据集的物体分类任务上表现出色,准确率达到了 93.3%。但是,当模型中 10% 的突触衰减后,准确率大幅下降了约 25%。之后,研究人员用不同数量的图像对未受影响的突触进行重新训练,发现训练图像数量越多,模型准确率恢复得越高。比如,用 5000 张图像重新训练后,准确率提高到了 83.0 ± 1.87%;用 1000 张图像重新训练,准确率为 76.6 ± 6.06%;用 100 张图像重新训练,准确率只有 70.8 ± 21.8%。而且,随着突触衰减程度增加,准确率的标准差也在增大,这意味着模型的表现变得更不稳定。研究人员还发现,即使在突触衰减程度高达 60% 的情况下,用 1000 张图像重新训练一次,模型的准确率也能从衰减状态下的 15.0 ± 7.01% 提高到 66.4 ± 6.12%。不过,当衰减程度达到 70% 及以上,用 100 张图像重新训练的模型就很难恢复到较高的准确率了。为了验证这些结果的可靠性,研究人员又用了压缩 ResNet - 56 模型进行实验,得到了类似的结果。

表征相似性的逐层分析


除了关注模型在视觉任务上的表现,研究人员还想知道受伤后的 CNN 模型能否恢复到和初始健康状态相似的内部表示。他们通过计算 CKA 值来量化模型在退化过程中各层的变化。CKA 值就像是一个 “相似度探测器”,最高为 1.0,表示完全相似。结果发现,即使模型退化程度很高,比如 80% 的突触衰减时,早期层仍然和健康模型的对应层有很高的相似性,而后期层则更容易受到影响。在权重衰减达到 40 - 60% 时,模型的深层和健康模型相比,相似性偏差开始变大。不过,经过一次重新训练,后期层的 CKA 值能恢复到中等水平,大约为 0.6。而且,重新训练的数据集越大,模型和健康模型的相似性就越高。这说明模型的内部表示似乎不太依赖模型结构,而是和训练任务关系更大。

患病模型嵌入物体类别信息


研究人员发现,在模型的第 36 层,CKA 分析显示其表征相似性有很大偏差。于是,他们从测试集图像中提取了这一层的激活信息,并进行了主成分分析(PCA)。结果发现,健康模型在这一层的特征表示能很好地根据物体类别进行聚类,而当 50% 的模型权重衰减后,特征表示变得混乱,不同类别的信息重叠在一起。重新训练后,模型又能重新组织特征表示,恢复一定的物体识别能力,这从聚类结果中可以明显看出。对于第 26 层,同样进行分析后发现,它似乎更容易受到损伤影响,但重新训练后,其类别的表示更加密集,而且能更明显地根据物体是有生命还是无生命进行编码。

从研究结论和讨论部分来看,这项研究有着非凡的意义。研究人员成功建立并测试了一个计算机模拟模型,用于模拟视觉皮层中神经退行性疾病,尤其是后皮质萎缩(PCA,一种伴随阿尔茨海默病且主要影响视觉皮层的疾病 )的发展过程。他们通过模拟 tau 蛋白积累导致的突触衰减,发现即使在突触高度衰减和有限的重新训练数据情况下,模型仍能恢复一定的物体分类准确率和内部表示的相似性,这和阿尔茨海默病及后皮质萎缩患者的认知能力逐渐下降的情况很相似。而且,模型早期层在整个过程中能保持较高的相似性,后期层则更容易受到损伤,这也和患者的视觉认知能力变化相符。患者在患病过程中,虽然处理低级视觉信息(如边缘和曲率)的能力可能还在,但识别完整物体的能力会下降。

不过,研究人员也清楚地认识到,CNNs 和生物视觉系统在信息处理上还是存在差异的,比如 CNNs 的卷积滤波器是全局的,而人类视觉系统的滤波单元负责特定区域;CNNs 的训练方式和哺乳动物视觉系统的学习机制也不同。而且,当前模型主要模拟的是后皮质萎缩,没有涉及阿尔茨海默病中 tau 蛋白在海马体(大脑中处理记忆和空间信息的重要结构 )的初始病变。未来的研究可以朝着探索神经退行性疾病对模拟海马体功能的循环网络的影响,以及进行层特异性损伤研究等方向展开。同时,用患者的神经生物标志物来进一步验证模型结果,根据个体差异优化模型,也是非常有意义的研究方向。

总的来说,这项研究为我们理解神经退行性疾病的发展机制打开了一扇新的窗户,虽然目前的模型还存在一些局限性,但它为后续研究提供了重要的基础和方向,有望在未来推动神经退行性疾病的诊断、治疗和管理取得重大突破。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号