德国汉堡 - 埃彭多夫大学医学中心计算神经科学研究所(Institute of Computational Neuroscience, Center for Experimental Medicine, University Medical Center Hamburg-Eppendorf)的 Niklas Laasch、Wilhelm Braun 等人在《Scientific Reports》期刊上发表了题为 “Comparison of derivative-based and correlation-based methods to estimate effective connectivity in neural networks” 的论文。这篇论文在神经科学领域意义重大,为深入理解神经网络的连接结构和功能提供了重要依据,有助于推动计算神经科学和神经连接组学(研究神经系统中神经元之间连接关系的学科)的发展。
研究背景
在神经科学研究中,仅通过观察神经系统组成部分的活动来推断其潜在的连接结构,一直是一项极具挑战性的任务。理解神经网络的连接结构,对于阐释大脑功能和神经系统的工作机制至关重要。目前,从观察到的神经元活动模式来估计有效连接性(描述一个神经节点的活动如何从机制上影响其他节点活动的指标),还没有一种被普遍接受的方法。
在神经网络研究中,有结构连接(Structural Connectivity,SC)、功能连接(Functional Connectivity,FC)和有效连接(Effective Connectivity,EC)这三种主要的连接模式。SC 指的是神经元素之间实际测量的解剖连接,例如通过白质束来确定。获取 SC 的可靠详细信息往往需要进行侵入性实验,这在人体研究中受到很大限制。FC 是最常被考虑的连接模式,例如在静息态功能磁共振成像(resting-state functional magnetic resonance imaging,fMRI)、脑电图(electroencephalography,EEG)和脑磁图(magnetoencephalography,MEG)记录中都会用到。它通过相关性测量来反映大脑区域之间的统计依赖关系,但不需要节点的动力学模型,是一种无模型的方法。然而,FC 也存在一些问题,比如基于成对相关性估计的 FC 会导致对称的连接矩阵,而且活动相关性不一定能反映结构连接。EC 则用于估计因果连接,它是一种基于模型的方法,除了需要 SC 信息外,还需要对每个节点的动力学做出假设,能够解释网络效应(即两个节点可能没有连接或连接较弱,但相关性却很强)。目前获取 EC 的标准方法包括格兰杰因果关系(Granger causality)、动态因果建模(Dynamic Causal Modeling)、贝叶斯网络(Bayesian networks)和传递熵(transfer entropy)等。但总体来说,估计神经系统中的 SC 和 EC 在实验和理论上都面临着很大困难。
研究方法
滞后互相关(Lagged Cross-Correlation,LCC)分析 :这是研究人员提出的主要新方法,基于傅里叶变换。该方法通过估计两个信号之间互相关最大化的滞后时间,并将这个最大互相关值作为两个节点之间连接强度和方向性的近似值。具体计算过程为,先将信号通过快速傅里叶变换(Fast Fourier Transformations,FFTs)转换到频域,计算互谱密度,再通过逆快速傅里叶变换(Inverse Fast Fourier Transformation,IFFT)得到时域的互相关。通过比较不同滞后时间的互相关值,确定最大互相关的滞后时间,以此判断连接的方向性,最后用皮尔逊相关系数填充估计的连接矩阵。
LCC 与动态微分协方差(Dynamic Differential Covariance,DDC)结合的方法 :将 LCC 方法和 DDC 算法得到的两个矩阵进行比较,只采用两个估计连接中都存在且超过一定阈值(通常设为 0.1)的值。DDC 假设给定的时间序列数据由线性或非线性自治动力系统生成,通过一系列矩阵运算来估计连接矩阵。
其他方法 :为了进行对比,研究还采用了一些其他方法,如对数据进行每 15 个时间点采样(Cut 方法)以降低信噪比;对估计结果进行阈值处理(Thresholded 方法),将低于阈值(0.1)的值设为 0;使用传递熵(Transfer Entropy)和偏相关(Partial Correlation)等方法。其中,传递熵使用 netrd 库中的实现,偏相关则通过 python 的 scikit-learn 包计算,并使用 L1 正则化。
神经元和网络模型 :为了验证这些方法,研究人员使用了两种神经元模型。一是 Hopf 神经元模型,这是一种非线性动力系统,通过分岔机制模拟神经元网络的活动,每个神经元的动力学由 Stuart - Landau 方程描述。模型中包含了 Hopf 分岔参数、自然频率参数、全局耦合强度、距离相关的时间延迟以及外部输入(以 Ornstein - Uhlenbeck 过程表示)等参数。二是线性模型,由每个节点的单个线性方程描述,是一个耦合的 Ornstein - Uhlenbeck 过程系统。
网络模型和数据生成 :构建了包含不同数量( )神经元的神经网络模型,神经元之间的连接基于成对概率 随机生成,形成有向非对称图,以模拟生物神经网络中的稀疏连接模式。在 Hopf 模型中,生成的数据集包含 200000 个时间步的时间序列,所有统计计算都基于这些时间序列的整个长度。
正向模拟 :为了验证估计连接的准确性,研究人员先估计连接矩阵,然后使用估计的连接矩阵对 Hopf 模型进行正向模拟,以重新创建时间序列数据。在模拟过程中,确保与原始数据使用相同的初始参数和 Ornstein - Uhlenbeck 过程的随机种子。
研究结果
Hopf 模型中连接性估计方法的比较 :研究人员首先在 Hopf 模型的小网络( )上使用 LCC 方法估计已知的真实连接性,结果显示 LCC 方法在估计 Hopf 神经元模型的潜在连接性方面表现出了极高的准确性,估计连接矩阵(Estimated Connectivity Matrix,EStC)与真实连接矩阵(Ground Truth Connectivity Matrix,GT)的皮尔逊相关系数达到 0.97,而 DDC 算法的相关系数仅为 0.52。
进一步研究不同算法在固定大小的小网络中随着连接性增加的性能变化,结果表明,对于稀疏网络,LCC 与 DDC 结合的方法表现最佳,LCC 单独使用时性能也很好;基于 DDC 的方法性能低于基于 LCC 的方法,尤其是在较高连接密度下;标准方法(包括偏相关和朴素传递熵,Naive Transfer Entropy,NTE)的性能优于 DDC,但不如 LCC。所有方法的性能最初都随着连接密度的增加而急剧下降,LCC 方法在平均邻居数达到 4 - 5 之前都表现出较高的性能。
研究还发现,Hopf 模型的参数,如控制动力学状态的参数
、延迟分布以及噪声参数
和
等,都会影响估计性能。对于小延迟,阈值化的 LCC 方法表现最佳;对于大延迟,阈值化的 DDC 方法表现最佳。所有方法的性能都随着参数
从负值增加到正值(对应从线性到非线性状态的转变)而下降。噪声参数对估计性能的影响呈现非单调关系,在噪声参数的中间值处,估计性能最佳。
此外,研究人员还探究了网络大小对 LCC 性能的影响。结果表明,当保持
(
为连接概率,
为神经元数量)不变时,LCC 的性能与网络大小近似无关,主要取决于每个神经元的平均输入数量
。当
时,LCC 与 DDC 结合的最佳算法性能会下降。
2.
线性模型中连接性估计方法的比较 :在节点动力学由线性随机微分方程描述的线性模型中,研究人员预期 DDC 在考虑足够长的轨迹时,能够近乎完美地重建真实连接性,因为 DDC 是线性系统的最小二乘误差估计器。实验结果也证实了这一点,在小网络中,DDC 及其阈值化变体表现出很高的性能,几乎与连接概率
无关;而基于 LCC 的方法在所有
值下性能都低于 DDC,尤其是在较大的
值时,这是因为 LCC 方法会遗漏许多实际存在的连接。基于相关性的方法在
值增加时,性能先略微下降,然后增加;Cut LCC 在较大
值时表现出与基于相关性的方法相似的行为,并且在较小
值时性能优于它们。NTE 在连接概率增加时,最初性能没有提高,低于 DDC、LCC 和基于相关性的方法,但在
时,与 DDC 和基于相关性的方法性能相当。
在较大的网络(
和
)中,DDC 方法同样优于其他方法,并且阈值化的 DDC 变体性能更高。由于线性模型没有延迟,LCC 算法在确定数据的方向性方面存在困难,导致假阴性率增加,尤其是在连接概率较大时,LCC 更难以正确判断连接的方向性和存在性。研究还发现,与 NTE 相比,LCC 在小稀疏网络中具有更高的准确性和更低的计算成本。
3.
使用不同 EStC 矩阵重建节点动力学 :研究人员使用估计的连接矩阵对 Hopf 模型进行正向模拟,以重建每个节点的时间序列。结果发现,当 EStC 接近 GT 矩阵时,通过系统的正向模拟可以准确地重建节点动力学。例如,使用 LCC 方法估计连接性时,重建数据与原始数据的轨迹相关性更高,在所有 10 个神经元上,LCC 方法重建数据与原始数据的相关性达到 0.91,而 DDC 方法仅为 0.8。这是因为 DDC 方法得到的 EStC 矩阵不太稀疏,错误识别的连接会间接影响其他神经元的活动,从而降低了重建活动与真实活动的相关性。此外,噪声参数也会影响重建性能,在噪声参数的中间值处,重建性能最佳。
4.
应用于秀丽隐杆线虫(C. elegans)数据 :研究人员将 LCC 方法应用于秀丽隐杆线虫 8 个最活跃的运动神经元的数据集,与最近使用水库计算(reservoir computing)方法的研究相比,LCC 方法在相同的假阳性数量下,具有更高的真阳性数量(21 比 14)。通过选择合适的二值化阈值(在 0.2 附近),LCC 方法能够更好地推断秀丽隐杆线虫的连接性。不过,研究也发现,可靠地估计秀丽隐杆线虫的连接性对现有的算法来说仍然是一个挑战,所有方法的性能都相对较低。
研究结论与讨论
这项研究开发并验证了一种从观察到的神经活动数据中估计网络有效连接性的方法,该方法基于 LCC 分析,并且在与 DDC 结合时,能够在具有时空延迟的非线性模型中成功地重建模型连接性,尤其是在稀疏网络中表现出色。在与其他方法的比较中,研究发现不同方法在不同的网络动力学和连接密度下各有优劣。在非线性动力学和小延迟的情况下,LCC 是首选方法;在线性动力学且延迟较小 / 不存在或较大的情况下,DDC 方法更优;对于非线性动力学且大延迟的情况,阈值化的 DDC 方法表现更好。
研究人员还通过正向模拟证明了使用估计的连接矩阵可以重建系统动力学,这有助于弥合结构连接和有效连接之间的差距。此外,将 LCC 方法应用于秀丽隐杆线虫的生物数据,显示出该方法在实际生物数据处理中的有效性和优势,能够比现有方法更准确地推断连接性。
然而,目前的研究仍然存在一些挑战。例如,在处理部分观察到的动力学问题时,即使 LCC 方法不需要完全可观测性的假设,但当网络动力学受外部驱动较强时,仍可能会受到混杂因素的影响。未来的研究可以考虑更全面地观察网络或在估计算法中考虑外部输入,以解决这一问题。另外,研究抑制性神经元网络中的连接性估计也是一个重要的研究方向,初步结果表明 LCC 方法在这类网络中得到的估计连接矩阵与真实矩阵具有互补结构。研究人员还设想将当前的方法与基于模拟的推理方法相结合,以进一步提高连接性估计的准确性和可靠性。
总的来说,这项研究为神经连接组学提供了重要的方法和思路,有助于推动对神经网络连接结构和功能的深入理解,为后续的神经科学研究奠定了坚实的基础。
打赏
下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究
10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!
欢迎下载Twist《不断变化的CRISPR筛选格局》电子书
单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析
下载《细胞内蛋白质互作分析方法电子书》