病毒从何而来?AlphaFold和其他人工智能正在寻找答案

【字体: 时间:2024年09月25日 来源:nature

编辑推荐:

  人工智能预测的蛋白质结构已经绘制出了导致登革热和丙型肝炎的病毒家族的进化图谱。

  

人工智能(AI)正在帮助重新绘制病毒家谱。由AlphaFold和受聊天机器人启发的“蛋白质语言模型”生成的预测蛋白质结构揭示了病毒家族中一些令人惊讶的联系,这些病毒家族包括感染人类的病原体和新出现的威胁。

科学家对病毒进化的理解大多是基于基因组比较。但是,病毒的闪电般的进化——尤其是那些基因组写在RNA中的病毒——以及它们从其他生物体获取遗传物质的倾向意味着,基因序列可以隐藏病毒之间深厚而遥远的关系,这种关系也可能因所检测的基因而异。

相比之下,病毒基因编码的蛋白质的形状或结构往往变化缓慢,这使得发现这些隐藏的进化联系成为可能。但是,英国格拉斯哥大学的分子病毒学家Joe Grove说,在AlphaFold等能够大规模预测蛋白质结构的工具出现之前,不可能比较整个病毒家族的蛋白质结构。

在本月发表在《自然》杂志上的一篇论文中,Grove和他的团队展示了基于结构的方法在黄病毒中的作用——黄病毒包括丙型肝炎病毒、登革热病毒和寨卡病毒,以及一些可能对人类健康构成威胁的主要动物病原体和物种。

病毒如何进入

许多研究人员对黄病毒进化的理解是基于复制其遗传物质的缓慢进化酶序列。然而,科学家对黄病毒用来入侵细胞的“病毒进入”蛋白的起源知之甚少,这种蛋白决定了它们可以感染的宿主范围。Grove认为,这一差距阻碍了有效丙型肝炎疫苗的开发,丙型肝炎每年导致数十万人死亡。

“在序列水平上,事物是如此的不同,以至于我们无法判断它们是否相关,”他说。“蛋白质结构预测的出现解开了整个问题,我们可以很清楚地看到事情。”

研究人员使用DeepMind的AlphaFold2模型和科技巨头Meta开发的结构预测工具ESMFold,为458种黄病毒的蛋白质生成了33000多个预测结构。ESMFold是基于数千万个蛋白质序列训练的语言模型。与AlphaFold不同的是,它只需要一个输入序列,而不是依赖于来自相似蛋白质的多个序列,因此它可能对审查最神秘的病毒特别有用。

预测的结构使作者能够识别出与已知黄病毒序列非常不同的病毒进入蛋白。他们发现了一些意想不到的联系。例如,包括丙型肝炎在内的病毒子集使用一种与他们在鼠疫病毒中发现的系统相似的系统感染细胞。鼠疫病毒包括引起猪出血热的猪瘟病毒和其他动物病原体。

人工智能启动的比较表明,这种进入系统与许多其他黄病毒不同。“对于丙型肝炎及其近亲,我们不知道它的进入系统来自哪里。它可能是在很久以前由那些病毒‘发明’的,”Grove说。

从细菌中窃取

预测的结构还表明,经过充分研究的寨卡病毒和登革热病毒的进入蛋白与那些被格罗夫描述为“奇怪而奇妙”的黄病毒具有相同的起源,这些黄病毒具有巨大的基因组,包括能引起人类发烧的Haseki蜱病毒。另一个令人惊讶的发现是,一些黄病毒有一种酶,似乎是从细菌那里偷来的。

“这将是前所未有的,”澳大利亚悉尼大学的病毒学家Mary Petrone说,如果不是她的团队今年在一种特别奇怪和奇妙的黄病毒物种中发现了类似的盗窃行为的话。她补充说:“基因盗版可能在塑造黄病毒的进化过程中发挥了比以前认为的更大的作用。”

瑞士洛桑大学的计算生物学家David Moi表示,黄病毒的研究只是冰山一角,其他病毒甚至一些细胞生物的进化史很可能会被人工智能改写。“我们将用新一代的工具重新讲述他们的故事,”他说。“现在我们可以看得更远一点,所有这些东西都必须有一点更新。”

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号