科学家的福音,两大AI预测蛋白质结构的算法开源

【字体: 时间:2021年07月19日 来源:生物通

编辑推荐:

  DeepMind公司和华盛顿大学开发的蛋白质结构预测工具同一天在杂志上发表,并且都是开源的,可以自由访问。

  

7月15日,总部位于伦敦的DeepMind公司发布了其深度学习神经网络AlphaFold 2的开源版本,并将其方法发表在《Nature》杂志上。去年,AlphaFold 2在国际蛋白质结构预测竞赛(CASP)中击败了众多对手。

与此同时,华盛顿大学医学院的研究团队受到AlphaFold 2的启发也开发了自己的蛋白质结构预测工具。这款工具名为RoseTTaFold,性能几乎和AlphaFold 2相当。他们同一天也在《Science》杂志上发表了文章。

芝加哥大学的计算生物学家Jinbo Xu认为,这些工具的开源性质意味着科学界应该能够在现有进展的基础上开发出更强大、更有用的软件。他本人没有参与这两项工作。

蛋白质是由一长串的氨基酸组成的,当它们折叠成3D形状时,也就决定了这些蛋白质在细胞中的功能。几十年来,研究人员一直采用X射线晶体延伸和冷冻电镜等实验技术来确定蛋白质结构。不过,这些方法既耗时又费钱,而且有些蛋白质不适合这样的分析。

去年,DeepMind在科学界掀起了轩然大波,它展示了自己的软件仅通过蛋白质序列就能准确预测许多蛋白质的结构,轻松解决了几十年的挑战。AlphaFold 2在两年一次的蛋白质预测竞赛中表现出色,以至于该竞赛的联合创始人宣称,“从某种意义上说,问题已经解决了”。

DeepMind一直对它的工作守口如瓶,只是在CASP上的一段简短演讲中介绍了AlphaFold 2。它承诺将发表一篇论文,更详细地概述这个神经网络,并将该软件提供给研究人员,但是除此之外几乎没有说什么。

华盛顿大学西雅图分校的生物化学家David Baker表示:“学术界对此有相当多的悲观情绪。如果有人已经解决了你正在处理的问题,但没有透露他们是如何做到的,那么你该如何继续解决它?”他领导的研究团队开发出RoseTTaFold。

于是,Baker及其同事开始集思广益,想办法复制AlphaFold 2的成功。他们确定了几个关键进展,包括神经网络如何使用与研究目标在进化上相关的蛋白质信息,以及蛋白质某一部分的预测结构对神经网络处理其他部分的序列有何影响。

RoseTTaFold的表现得几乎和AlphaFold 2一样好,而且比蛋白质预测竞赛中的其他参赛作品要好得多。目前还不清楚为什么它不能与AlphaFold 2匹敌,可能原因在于DeepMind对深度学习更加在行。

此外,DeepMind还简化了AlphaFold 2。AlphaFold的首席研究员John Jumper表示,尽管神经网络需要几天的计算时间来生成一些蛋白质的结构,但开源版本的速度要快16倍。它可以在几分钟到几小时内生成结构,具体取决于蛋白质的大小。这与RoseTTaFold的速度相当。

尽管AlphaFold 2的源代码是免费提供的,但对于没有专业技能的研究人员来说,它可能不是特别有用。DeepMind的科学人工智能负责人Pushmeet Kohli表示,DeepMind已经与一些选定的研究人员和组织合作,以预测特定的目标,但它希望扩大普及范围。“在这个领域,我们还有很多事情要做。”

除了免费提供RoseTTaFold的代码外,Baker的团队还建立了一个服务器,让研究人员可以在其中插入蛋白质序列并得到预测的结构。他表示,自从上个月启动以来,该服务器已经预测了大约500人提交的5000多种蛋白质的结构。

随着RoseTTaFold和AlphaFold 2都开始免费提供代码,研究人员将能够在这两项进步的基础上再接再厉。据介绍,人们感兴趣的两个领域是预测多个相互作用的蛋白质复合物的结构以及应用软件来设计新的蛋白质。

##

Jumper, J. et al. Nature https://doi.org/10.1038/s41586-021-03819-2 (2021).

Baek, M. et al. Science https://doi.org/10.1126/science.abj8754 (2021).

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号