Nature Computational Science:机器学习如何改善COVID-19预测模型

【字体: 时间:2021年12月02日 来源:Nature Computational Science

编辑推荐:

  在先进的机器学习技术的帮助下,来自布朗大学的研究人员提出了一些策略,以提高用于预测大流行过程的流行病学模型的性能。2021年1月,研究小组根据时间调整参数对未来6个月进行了预测。

  
   

SIR Models    

图像:SIR模型用于估计病原体如何在人群中移动。布朗大学的研究人员已经证明,机器学习可以让它们更具预测性。

资料来源:布朗大学Karniadakis实验室

罗德岛州普罗维登斯[布朗大学]-在COVID-19大流行期间,病例率以流行病学模型难以预测的方式起起落落。布朗大学数学家的一项新研究使用了一种先进的机器学习技术来探索常用模型的优缺点,并提出了使它们更具预测性的方法。

“在建模领域有句老话,‘所有的模型都是错误的,但有些是有用的,’”布朗大学应用数学和工程学教授乔治·卡尔尼亚达基斯(George Karniadakis)说,他是发表在《自然计算科学》(Nature Computational Science)杂志上的这项研究的资深作者。“我们在这里展示的是,主要的COVID-19模型是错误的,也不是很有用——至少在预测大流行的进程方面。星期一早上有很多的四分卫,但没有很多准确的预测。”

为了找出原因,该团队研究了9个主要的COVID-19模型,所有这些模型都是“易感染-清除”模型或SIR模型的一些变体。这些模型将一个群体划分为不同的类别:尚未被感染(易感者)、已被感染并能将病毒传播给他人(传染性)和已被感染但不能再传播病毒(已被消除)。SIR模型更复杂的版本包括额外的垃圾箱,捕捉隔离率、住院率、死亡率和其他可能影响病毒传播的数量。

有许多因素会影响个体从一个箱子到另一个箱子的移动。例如,从“易感”到“传染性”的转变取决于病毒在人与人之间传播的效率,以及人们密切接触的频率。这些因素中有许多不能直接观察到,因此模型必须从现有数据中推断出它们的值。在建模术语中,这些因素被称为参数。

研究发现,COVID-19模型的一个主要缺陷是,它们将关键参数值视为随着时间的推移是固定的,尽管这些因素在现实世界中发生了戏剧性的变化。例如,该病毒的社区传播率因口罩使用、企业关闭和重新开业以及其他措施而有很大差异。住院率随着时间的推移而变化,因为医院床位的供应发生了变化。死亡率随着新的治疗方法而改变。研究人员发现,所有这些不断变化的因素改变了病例率和死亡率的轨迹,但目前的模型保持了这些参数的稳定,这导致了糟糕的预测。

下一个问题是,是否有一种方法可以在流行病学模型中捕捉这些变化的参数。为此,研究小组使用了基于物理的神经网络(PINNs)——一种由Karniadakis和他的同事在布朗大学开发的机器学习技术。pin是一种神经网络,类似于那些用于识别图像或将语音转录为文本的神经网络。但与标准神经网络不同的是,pin网络配备了描述控制系统的物理定律的方程式。Karniadakis和他的团队首先使用pinn从图像和视频中发现流体流动的速度和压力。在这些情况下,pinn配备了流体动力学中使用的方程。在这种情况下,研究小组用方程式装备了pin,用来计算病原体如何传播。

布朗大学访问学者、该研究的联合首席作者Ehsan Kharazmi说:“考虑到流行病是随时间演变的,而且不断收集数据,在收集新数据时可以对pin进行再培训,并随着时间的推移用推断的参数更新模型。”“与大流行演变的时间尺度相比,用新数据重新培训pin所需的计算时间相对较短。”

该团队向装备了pin - n的模型输入真实世界的数据——来自纽约市、罗德岛州和密歇根州,以及来自意大利的国家数据——并允许pin - n在一段时间内推断关键参数的值。pinn还能够量化他们关于推断参数的不确定性。然后,该团队使用pinn信息模型对未来进行预测。2021年1月,研究小组根据时间调整参数对未来6个月进行了预测。然后,在比较实际病例率和他们的预测时,他们发现2021年1月至6月的实际病例率在模型预测的不确定性窗口内。研究中使用的四组数据都是如此。

这些发现表明,虽然没有任何模型能够准确地捕捉在一场大规模流行期间发生的所有动态,但能够实时调整关键参数的模型可能有助于更有用的预测。

Kharazmi说:“使用pin的推断模型可以通过调整模型参数来评估未来可能的轨迹。”“这可以为制定或调整政策提供一些见解。”

该研究得到了美国国防部多学科大学研究计划(W911NF-15-1-0562)的支持。

编者感兴趣的是:这个方法对未来6个月的预测,又是什么呢?



杂志

自然计算科学

DOI

10.1038 / s43588 - 021 - 00158 - 0

方法的研究

计算模拟/建模

研究的主题

不适用

文章标题

使用物理信息神经网络的整数和分数阶流行病学模型的可识别性和可预测性

文章出版日期

22日- 11月- 2021

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号