新药的“化学ChatGPT”

【字体: 时间:2024年10月25日 来源:AAAS

编辑推荐:

  波恩大学的研究人员训练了一个人工智能过程来预测具有特殊性能的潜在活性成分。因此,他们推导出了一种化学语言模型——一种分子的ChatGPT。经过一个训练阶段,人工智能能够准确地重现具有已知双靶标活性的化合物的化学结构,这些化合物可能是特别有效的药物。这项研究已经发表在《细胞报告:物理科学》上。

  

波恩大学的研究人员训练了一个人工智能过程来预测具有特殊性能的潜在活性成分。因此,他们推导出了一种化学语言模型——一种分子的ChatGPT。经过一个训练阶段,人工智能能够准确地重现具有已知双靶标活性的化合物的化学结构,这些化合物可能是特别有效的药物。

如今,想要在奶奶90岁生日时为她写首诗让她高兴的人,不需要成为诗人:只需在ChatGPT中输入一个简短的提示,人工智能就会在几秒钟内吐出一长串与寿星名字押韵的单词。如果你愿意,它甚至可以创作出一首十四行诗。

波恩大学的研究人员在他们的研究中实现了一个类似的模型——被称为化学语言模型。然而,这不会产生押韵。相反,人工智能显示了化合物的结构式,这些化合物可能具有特别理想的特性:它们能够结合两种不同的目标蛋白质。在生物体中,这意味着,例如,它们可以同时抑制两种酶。

需要:具有双重功效的活性成分

Jürgen Bajorath博士解释说:“在药物研究中,这些类型的活性化合物由于其多药理学而非常理想。”这位计算化学专家领导着拉玛机器学习和人工智能研究所的生命科学领域的人工智能,以及波恩大学b-it(波恩-亚琛国际信息技术中心)的生命科学信息学项目。“由于具有理想的多靶点活性的化合物同时影响几种细胞内过程和信号通路,因此它们通常特别有效,例如在对抗癌症方面。”原则上,这种效果也可以通过不同药物的联合给药来实现。然而,存在不必要的药物-药物相互作用的风险,而且不同的化合物在体内也常常以不同的速率分解,这使得很难同时使用它们。

找到一种能对单一靶蛋白产生特殊影响的分子并非易事。设计具有预定双重效应的化合物就更加复杂了。化学语言模型在未来可能会有所帮助。ChatGPT接受了数十亿页书面文本的训练,并学会了自己组织句子。化学语言模型以类似的方式工作,但只有相对非常少的数据可用于学习。然而,原则上,它们也被输入文本,比如所谓的SMILES字符串,它将有机分子及其结构显示为一系列字母和符号。Bajorath研究小组的Sanjana Srinivasan说:“我们现在已经用成对的字符串训练了我们的化学语言模型。”“其中一根弦描述了一种分子,我们知道它只对一种目标蛋白质起作用。另一种是一种化合物,除了这种蛋白质外,还会影响第二种目标蛋白质。”

人工智能学习化学连接

该模型被喂食了7万多对这样的狗。这使得它获得了一种隐性知识,即正常活性化合物与具有双重作用的化合物有何不同。巴约拉斯解释说:“当我们给它喂食一种针对目标蛋白质的化合物时,它会在此基础上提出一些分子,这些分子不仅可以针对这种蛋白质,还可以针对另一种蛋白质。”

具有双重效果的训练化合物通常针对相似的蛋白质,从而在体内发挥相似的功能。然而,在药物研究中,人们也在寻找影响完全不同类别的酶或受体的活性成分。为了让人工智能做好这项任务的准备,在一般学习阶段之后进行了微调。研究人员使用了几十对特殊的训练来教算法建议的化合物应该针对哪些不同类别的蛋白质。这有点像指示ChatGPT这次不创建十四行诗,而是创建打油诗。

在微调之后,模型实际上吐出了已经被证明对目标蛋白质的理想组合起作用的分子。“这表明这个过程是有效的,”Bajorath说。然而,在他看来,这种方法的优势并不在于可以立即发现比现有药物效果更好的新化合物。他解释说:“在我看来,更有趣的是,人工智能经常提出大多数化学家甚至不会马上想到的化学结构。”“在某种程度上,它激发了‘打破常规’的想法,并提出了原创的解决方案,从而产生了新的设计假设和方法。”

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号