-
生物通官微
陪你抓住生命科技
跳动的脉搏
Cell:人工智能发现超过16万种新病毒
【字体: 大 中 小 】 时间:2024年10月11日 来源:AAAS
编辑推荐:
使用机器学习工具发现了161,979种新的RNA病毒,研究人员认为这将极大地改善地球上的生命图谱,并有助于识别数百万种尚未被表征的病毒。
人工智能(AI)已经被用来揭示生活在我们脚下和地球每个角落的生命的多样化和基本分支的细节。
使用机器学习工具发现了161,979种新的RNA病毒,研究人员认为这将极大地改善地球上的生命图谱,并有助于识别数百万种尚未被表征的病毒。
该研究发表在《细胞》杂志上,由一个国际研究小组进行,是迄今为止发表的最大的病毒物种发现论文。
悉尼大学医学与健康学院医学科学学院的资深作者Edwards Holmes 教授说:“我们为了解地球上隐藏的生命提供了一扇窗户,揭示了非凡的生物多样性。”
“这是在一项研究中发现的数量最多的新病毒物种,极大地扩展了我们对生活在我们身边的病毒的认识,一下子发现这么多新病毒是令人兴奋的,它只是触及表面,打开了一个发现的世界。还有数百万种细菌有待发现,我们可以用同样的方法来识别细菌和寄生虫。”
虽然RNA病毒通常与人类疾病有关,但它们也在世界各地的极端环境中被发现,甚至可能在全球生态系统中发挥关键作用。在这项研究中,它们被发现生活在大气、温泉和热液喷口中。
Holmes教授说:“极端环境携带了如此多类型的病毒,这只是它们在最恶劣环境中生存的惊人多样性和坚韧性的另一个例子,可能为我们提供病毒和其他基本生命形式是如何形成的线索。”
人工智能工具是如何工作的
研究人员建立了一个深度学习算法LucaProt,用于计算大量的基因序列数据,包括多达47250个核苷酸的长病毒基因组和基因组复杂信息,以发现超过16万种病毒。
“这些病毒中的绝大多数已经被测序,并存在公共数据库中,但它们的差异太大,没有人知道它们是什么,它们构成了通常被称为‘暗物质’的序列。我们的人工智能方法能够组织和分类所有这些不同的信息,首次揭示了暗物质的意义。
人工智能工具经过训练,可以计算暗物质,并根据所有RNA病毒用于复制的蛋白质的序列和二级结构来识别病毒。
它能够大大加快病毒发现的速度,如果使用传统方法,这将是耗时的。
来自中山大学的合著者、该研究的机构负责人Mang Shi教授说:“我们过去常常依靠繁琐的生物信息学管道来发现病毒,这限制了我们可以探索的多样性。现在,我们有了一个更有效的基于人工智能的模型,它提供了卓越的灵敏度和特异性,同时使我们能够更深入地研究病毒的多样性。我们计划将这种模式应用于各种应用。”
在阿里云智能Apsara实验室研究的合著者Zhao-Rong Li博士说:“LucaProt代表了尖端人工智能技术和病毒学的重要结合,表明人工智能可以有效地完成生物探索任务。这种整合为进一步解码生物序列和从新的角度解构生物系统提供了有价值的见解和鼓励。我们还将继续在AI病毒学领域进行研究。”
“很明显,下一步就是训练我们的方法来发现更多这种惊人的多样性,谁知道会有什么额外的惊喜在等着我们呢。”
知名企业招聘