融合深度学习与数学模型:精准预测疾病传播的创新之道

【字体: 时间:2025年04月30日 来源:Scientific Reports 3.8

编辑推荐:

  在疾病传播研究中,传统数学模型如 SIR 模型参数估计复杂,深度学习模型缺乏可解释性。研究人员提出结合传统数学建模与深度学习的模型,对西班牙 COVID-19 发病率预测效果良好,为公共卫生策略提供有力支持。

  新冠疫情的爆发,让人们深刻认识到理解疾病传播规律的重要性。传统的疾病传播数学模型,像易感 - 感染 - 康复(SIR)模型,能在一定程度上揭示疾病传播的动态变化,通过将人群划分为 “易感”“感染”“康复” 状态,用微分方程来描述其动态过程。在此基础上发展出的易感 - 暴露 - 感染 - 康复(SEIR)模型,引入 “暴露” 状态解释感染潜伏期,这些模型为公共卫生政策的制定提供了有价值的指导。
然而,随着研究的深入,问题也逐渐暴露出来。为了提高模型的预测准确性,研究人员尝试引入各种因素,这使得模型的时空动态变得极为复杂,参数估计难度大增,有时甚至会降低预测的准确性。而深度学习技术凭借其在其他领域展现出的卓越预测能力,也被应用到疾病传播建模中。像循环神经网络(RNN)和图神经网络(GNN),能够捕捉疾病传播中的时间和空间依赖关系,在预测准确性上超越了传统数学模型。但深度学习模型也有其短板,它牺牲了数学模型所具有的可解释性,复杂的模型结构让人难以理解其内部逻辑。

在这样的背景下,韩国大学(Department of Electronics and Information Engineering, Korea University)的研究人员开展了一项旨在解决上述问题的研究。他们提出了一种全新的混合模型,将传统数学模型与人工神经网络(ANN)和图神经网络(GNN)相结合,期望在提高预测能力的同时,保留模型的可解释性。该研究成果发表在《Scientific Reports》上。

研究人员为开展此项研究,主要运用了以下关键技术方法:首先,收集了西班牙 52 个省份在 2020 年 1 月 1 日至 2021 年 3 月 25 日期间的每日 COVID-19 发病率数据,以及 2018 年各地区之间的平均公共交通流量数据作为邻接矩阵。然后,对数据进行预处理,包括归一化和阈值处理,并将其划分为训练集和测试集。接着,构建了基于数学模型的深度学习模型 —— 扩散信息神经网络。在模型训练过程中,使用了标准的深度学习技术,如误差反向传播、先进的优化器和学习率调度,以获取最优参数。

下面来看看具体的研究结果:

  • 模型预测性能:通过控制模型的两个超参数 —— 时间窗口长度和 GCN 中的通道数,研究人员发现当时间窗口设为 14、GCN 通道数设为 16 时,模型在验证数据集上的预测性能最佳。与其他六个基线模型(持久性模型、长短期记忆网络(LSTM)、带 MLP 的 LSTM、自回归积分移动平均模型(ARIMA)和两个 GNN 基于模型)进行比较,该模型在测试数据集上取得了最高的相关系数,达到 0.9679,展现出了卓越的预测能力。
  • 模型参数数量:在深度学习模型中,该研究提出的模型参数数量最少,仅为 1135 个,约为具有边缘注意力的 GNN 模型参数数量的六分之一。这表明该模型结构更为简单,却能实现优异的预测性能。
  • 模型可解释性:该模型具有良好的可解释性。它的结构受数学模型启发,分为区域内生成项和周边区域影响项。通过可视化西班牙巴伦西亚地区的模型组件,发现生成项(Xt?m:tθg)能根据过去数据预测特定区域的每日发病率,反映区域内的内部因素和趋势;扩散项(k=1K?(AkXt?m:tθdk))则体现了周边区域对特定区域的影响,其值越高,该区域出现新发病例的概率越大。

在研究结论和讨论部分,该模型展现出诸多优势。它在预测 COVID-19 发病率方面具有最高的准确性和泛化能力,能有效捕捉全国和地区层面的发病趋势变化,为及时发现疫情爆发和制定精准的公共卫生策略提供支持。模型结合了数学模型和 ANN 的优点,既简化了深度学习模型的设计,又通过深度学习算法轻松估计参数,实现了良好的预测能力和可解释性。与其他复杂模型相比,该模型结构简单却性能卓越,表明简单结构对于疾病模型而言是足够的。

不过,该模型也存在一些局限性。由于数据集的限制,它无法直接替代 SIR 模型来估计公共卫生指标,如再生数,因为它没有对 “易感” 人群进行建模。此外,所使用的交通网络数据并非 COVID-19 期间的数据,且采用的分数阶微积分方法缺乏简单数学模型的直观可解释性。尽管如此,该模型在使用相同数据的情况下,性能优于基线模型,为 COVID-19 预测研究提供了新的方法和思路,在公共卫生策略制定和流行病学建模的未来发展中具有重要的应用价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号