-
生物通官微
陪你抓住生命科技
跳动的脉搏
人工智能学会“说”基因“方言”,以预测未来的SARS-CoV-2突变
Communications Biology:Paying attention to the SARS-CoV-2 dialect : a deep neural network approach to predicting novel protein mutations
【字体: 大 中 小 】 时间:2025年03月31日 来源:AAAS
编辑推荐:
与耗时的传统实验室实验相比,一种名为深度新突变搜索(DNMS)的强大人工智能模型更准确、更有效地预测病毒突变。该模型以SARS-CoV-2刺突蛋白为重点,使用一种专门的蛋白质语言模型进行微调,以理解病毒的特定“语言”。DNMS可以预测导致微小功能变化的突变,这对SARS-CoV-2等病毒至关重要,这些病毒通过微妙的调整来维持功能。这种方法有望通过更准确、更快速地预测突变来加强病毒追踪和公共卫生。
自2019冠状病毒病被宣布为全球大流行以来,已经过去了5年。随着SARS-CoV-2转变为地方性疾病,有关其未来演变的问题仍然存在。病毒的新变种可能会出现,在正向选择的驱动下,诸如增加的传播性、更长的感染持续时间和逃避免疫防御的能力。这些变化可能使病毒在以前接种过疫苗的人群中传播,可能引发新的感染浪潮。
预测病毒的新突变对于推进生命科学研究至关重要,特别是在试图了解病毒如何进化、传播和影响公共卫生时。传统上,研究人员依靠湿实验室实验来研究突变。然而,这些实验既昂贵又耗时。
佛罗里达大西洋大学工程与计算机科学学院的研究人员开发了一种预测蛋白质序列突变的新方法,称为深度新突变搜索(DNMS),这是一种使用深度神经网络的人工智能模型。
在这项研究中,他们专注于SARS-CoV-2刺突蛋白——病毒中负责帮助其进入人体细胞的部分——并使用蛋白质语言模型来预测这种蛋白质中前所未有的潜在新突变。
为此,研究人员使用了一种语言模型ProtBERT,该模型经过专门调整,以理解SARS-CoV-2刺突蛋白的“方言”。该模型的工作原理是观察潜在的突变,并根据几个因素对它们进行排序。其中包括语法性,这是指根据模型学到的语法规则,突变的可能性或“正确”程度,以及突变序列与原始蛋白质的相似程度,这是通过语义变化和注意力变化来衡量的。
发表在《通讯生物学》杂志上的研究结果表明,DNMS语言模型可以根据相似性将序列分成不同的组。该模型可以通过寻找仅引起蛋白质结构和功能微小变化的突变来预测哪些突变可能发生。这一点很重要,因为在大多数情况下,像SARS-CoV-2这样的病毒是通过微小的变化进化而来的,这些变化使它们能够在不大幅改变整体功能的情况下适应环境。
DNMS方法利用有关序列和突变的所有可用信息,对可能发生的突变进行更准确的预测。与之前的研究不同,DNMS通常着眼于参考蛋白序列的变化,而DNMS引入了亲子突变预测模型。亲本序列(一个现有的蛋白质序列)被用来预测突变,这些突变是基于它们如何随着时间的推移而进化来分析的。
“我们的模型对所有可能的突变进行排序,以找到未来最有可能发生的突变,”资深作者、复旦大学电气工程与计算机科学系教授朱兴权(音译)博士说。“我们的研究表明,蛋白质语法之后的突变,与原始序列相比变化很小,注意力差异也很低,被认为是最有可能的未来突变。”
该方法首先获取给定的SARS-CoV-2刺突蛋白序列,并模拟所有可能的单点突变。对于蛋白质的每个突变版本,DNMS使用ProtBERT模型来计算每个突变遵循蛋白质“语法”的可能性(语法性)以及突变序列与原始序列的相似程度(语义变化)。此外,该模型还关注注意力,这是一种用于研究蛋白质结构和功能的测量方法,但以前从未应用于突变预测。
“我们方法的关键在于使用父序列提供的上下文。这个环境对于评估一个潜在的突变是否与蛋白质的‘语法’一致是至关重要的。”“DNMS的工作原理是从系统发育树(基本上是病毒株的家谱)中选择一个亲本序列,并模拟所有可能的突变。”
该研究还研究了预测突变与病毒适应性之间的关系,即病毒复制和存活的能力。研究结果表明,高语法性、小语义变化和低注意力变化的突变与较高的病毒适应性相关。这表明,符合蛋白质生物学“规则”并对蛋白质结构或功能造成最小破坏的突变更有可能对病毒有益。
“我们相信仅使用序列数据就可以帮助做出这些预测,因为蛋白质遵循一定的生物学规则,”朱说。
研究人员通过统计分析验证了DNMS的有效性。他们的研究结果表明,DNMS在预测新突变方面优于其他方法,因为它将所有相关因素结合到一个更准确的预测模型中。
工程与计算机科学学院院长斯特拉·巴塔拉马博士说:“我们的研究人员开发的经过微调、预先训练的语言模型可以预测未来更有可能发生哪些SARS-CoV-2突变。”“这种方法可以用于指导实验研究,因为它提供了在人群中观察到突变之前的预测,帮助公共卫生官员在新突变广泛传播之前跟踪和准备。”
知名企业招聘
今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号