-
生物通官微
陪你抓住生命科技
跳动的脉搏
谷歌DeepMind公布蛋白质预测程序AlphaFold3代码
【字体: 大 中 小 】 时间:2024年11月12日 来源:AAAS
编辑推荐:
迟到总比不到好:谷歌DeepMind今天向GitHub社区公布了其最新人工智能(AI)蛋白质预测软件的计算机代码。许多科学家对这一举措感到高兴,尽管有些人仍然对该公司花了6个月才做到这一点感到不满。
当DeepMind在5月8日发表在《自然》杂志上的一篇论文中宣布AlphaFold3时,研究人员称赞这项技术不仅能够预测蛋白质的结构,还能预测它们如何与DNA、RNA和其他蛋白质相互作用,这对药物发现和其他领域来说是一个福音。但是他们批评了公告本身:尽管《自然》杂志的编辑指南指出,计算代码必须与已发表的研究一起提供,但这篇新论文只包含了“伪代码”——一个程序运行的步骤列表,以及一个在线门户网站的链接,该门户网站允许科学家每天进行有限数量的预测。
研究人员在一封获得数百个签名的公开信中指出,这种方法与DeepMind于2021年在《自然》杂志上发表的AlphaFold2(完整的代码)形成鲜明对比,违背了公认的开放性、可重复性和同行评议标准。在强烈反对之后,DeepMind承诺在论文发表后6个月内发布非商业用途的完整代码。
现在,它已经兑现了这一承诺。计算模型本身今天在代码库GitHub上公开,并获得了非商业许可,而“权重”——帮助调整人工智能模型工作方式的数字——则可供填写简短申请表的学者使用。
“我们要感谢社区的耐心,”DeepMind的科学副总裁Pushmeet Kohli说。虽然他和他的同事坚持他们发布程序的方式,他们认识到社区直接使用代码的愿望。为了今天的公开发布,他们花了几个月的时间来准备和测试这个模型。
研究人员对这一举动表示赞赏。“我很高兴(DeepMind团队)遵守了他们发布代码的承诺,因为这意味着对一篇重要论文的真正深入审查终于可以开始了,”斯德哥尔摩大学(Stockholm University)的生物物理学家、公开信的签名者Erik Lindahl说。范德比尔特大学(Vanderbilt University)的计算结构生物学家、这封信的组织者之一Stephanie Wankowicz补充说,“正在发布的模型和权重对于评估和建立这项工作非常重要”。不过,她说:“6个月的延迟是不可接受的。”
AlphaFold3是AlphaFold的最新版本,AlphaFold是一种人工智能,它彻底改变了仅根据氨基酸序列预测蛋白质结构的方法,并为DeepMind的两位研究人员John Jumper和Demis Hassabis赢得了今年早些时候的诺贝尔化学奖。然而,直到今天,研究人员只能通过DeepMind的在线门户使用该程序,该门户每天只允许10个(现在是20个)请求,使用一组有限的分子。
在5月份的一份声明中,《自然》杂志主编Magdalena Skipper没有具体说明为什么该杂志放弃了分享完整代码的要求,但表示编辑们考虑了“对生物安全和伦理挑战的潜在影响”等因素。与此同时,《自然》杂志的一篇新闻报道援引Kohli的话说,该团队限制了对AlphaFold3的访问,以避免影响从DeepMind剥离出来的商业机构Isomorphic Labs追求药物发现计划的能力。
Kohli现在告诉《科学》杂志,DeepMind的团队优先开发门户网站,而不是发布代码,“以确保我们为大多数人提供最简单的界面。”研究人员已经通过使用门户网站完成了一些“令人难以置信的工作”,并不会因今天的新闻而改变,他估计大多数科学家会继续这样做,因为这对计算能力有限的团队来说更实用。
DeepMind的研究人员还认为,与一些批评者的说法相反,《自然》杂志的论文是可复制的,事实证明,此后有多个团队基于伪代码制作了自己的AlphaFold3版本。百度、Ligo Biosciences、Chai Discovery等专注于人工智能的公司已经公布了这些努力的成果。
伦敦大学学院(University College London)生物信息学研究员Daniel Buchan指出,即使AlphaFold3的代码已经发布,这些替代的“实现”可能仍然有用。首先,“方法可以被复制是件好事,也很重要,”他说。Wankowicz补充说,比较和对比这些模型可能会导致未来的改进。
研究人员表示,最重要的是运行不用再受限制性用户许可的限制,就像非营利组织OpenFold联盟正在开发的那样。否则,福克斯蔡斯癌症中心(Fox Chase cancer Center)的计算结构生物学家Roland Dunbrack说:“如果我帮助同事……研究出一种可能是一种很好的先导抗癌药物的新型配体,而在某种程度上,他们想与制药公司合作将其商业化,事情就会变得非常复杂。”Dunbrack最初被要求为《自然》杂志审阅DeepMind的手稿,但从未收到代码。
许多研究团队已经计划使用AlphaFold3的代码。今天发表在《自然计算科学》(Nature Computational Science)杂志上的一篇论文描述了一个名为MassiveFold的程序,该团队表示,他们希望将AlphaFold3集成到自己的软件中。MassiveFold帮助用户利用并行计算来减少在AlphaFold2中运行大量预测所需的时间——可能从几个月到几个小时。通过整合DeepMind的新代码,“用户将能够(用这种方法)从AlphaFold2或AlphaFold3中获得最佳预测,”MassiveFold的开发者、法国国家科学研究中心(CNRS)生物信息学研究工程师Guillaume Brysbaert说。
Jumper表示,DeepMind团队非常期待今天的公开发布。“在AlphaFold2中,我们看到了如此多的创造力,”他说。“我真的很高兴看到。。。社区对AlphaFold3如何工作原理的发现——如何将其应用于(解决)新问题?”
知名企业招聘