-
生物通官微
陪你抓住生命科技
跳动的脉搏
《自然通讯》:让AlphaFold预测非常大的蛋白质
【字体: 大 中 小 】 时间:2024年11月05日 来源:AAAS
编辑推荐:
人工智能工具AlphaFold已经得到了改进,现在可以预测非常大而复杂的蛋白质结构的形状。林雪平大学研究人员还成功地将实验数据整合到该工具中。该研究结果发表在《自然通讯》杂志上,是朝着更有效地开发用于医疗药物等新蛋白质迈出的一步。
人工智能工具AlphaFold已经得到了改进,现在可以预测非常大而复杂的蛋白质结构的形状。林雪平大学研究人员还成功地将实验数据整合到该工具中。研究结果发表在自然通讯,这是朝着更有效地开发用于医疗药物等新蛋白质迈出的一步。
在所有生物体中,有各种各样的蛋白质调节细胞功能。基本上,身体中发生的一切,从控制肌肉和形成毛发到将氧气输送到血液和消化食物,都与蛋白质有关。但蛋白质也存在于体外,例如洗涤剂和药物中。
蛋白质是由20种不同的氨基酸组成的大分子,它们排成一长串,就像项链上的珠子一样。这些序列或链的长度从50到几千个氨基酸不等。这就产生了几十亿种不同的组合,进而决定了蛋白质的三维形状。根据蛋白质链的形状,即折叠方式的不同,蛋白质具有完全不同的功能。
50多年来,研究人员一直试图预测和设计不同的蛋白质结构,以更深入地了解身体的机制,各种疾病,并开发新型药物。这是一项费力而昂贵的任务,涉及大量的人工处理。
但在2020年,Deepmind公司发布了名为AlphaFold的开源软件。这是一种基于所谓神经网络的人工智能,它可以非常准确地预测蛋白质将如何折叠,从而预测它们将具有什么功能。这一突破也导致了2024年诺贝尔化学奖。
然而,该计划也有其局限性。除此之外,它还不能预测非常大的蛋白质化合物,也不能从实验或不完整的数据中得出结论。
研究人员现在已经开发出AlphaFold来进一步克服这些缺点。他们称之为af_unmask的工具现在可以从实验和部分数据中获取信息,并预测非常大而复杂的蛋白质结构。
“我们正在为AlphaFold提供一种新的输入方式。这个想法是从实验和神经网络中获得全貌,从而使构建更大的结构成为可能。但你也可以有一个结构的草稿,你把它输入AlphaFold,得到一个相对准确的结果,”林雪平大学物理、化学和生物学系的讲解员克劳迪奥·米拉贝洛说。
AF_unmasked背后的想法是让研究人员通过为研究人员如何设计蛋白质提供指导来改进所进行的实验。这是朝着更好地理解蛋白质的功能和设计新型蛋白质药物迈出的一步。
AlphaFold的突破之所以成为可能,是因为世界各地的研究人员从20世纪70年代开始收集数据库中大约20万种不同蛋白质的结构数据。这个数据库为AlphaFold提供了训练数据。最终使它大规模运行的是使用gpu进行大量计算的超级计算机的技术发展。
Björn Wallner是大学的生物信息学教授,曾与三位诺贝尔奖得主之一合作。
“蛋白质设计的可能性是无限的,只有想象力是有限的。开发出既可用于体内又可用于体外的蛋白质是可能的。当你解决了旧的问题后,你总是要找到新的、更困难的问题。在我们的领域,发现问题不是问题。”Björn Wallner说。
他与克劳迪奥·米拉贝洛(Claudio Mirabello)一起开发了AlphaFold的前身,这也启发了Deepmind开发该工具。多亏了这家谷歌旗下公司的资源,他们才能够开发出现在对世界蛋白质科学家来说不可或缺的工具。
AlphaFold并不是第一个使用深度神经网络来解决这个问题的工具。事实上,AlphaFold最重要的特征之一是它编码了神经网络内部蛋白质的进化史,这个想法实际上起源于LiU,并于2019年由Björn Wallner和我发表。所以,你可以说AlphaFold是基于我们的想法,现在我们正在AlphaFold的基础上进行开发,”克劳迪奥米拉贝洛说。
知名企业招聘