-
生物通官微
陪你抓住生命科技
跳动的脉搏
Nature:来认识一下你的人工智能实验室管家“Coscientist”吧!
全自动科研机器!
【字体: 大 中 小 】 时间:2023年12月22日 来源:AAAS
编辑推荐:
在不到四分钟的时间里,Coscientist 就利用团队提供的化学物质设计出了产生所需反应的精确程序。当它试图用机器人执行其程序时,它在编写的代码中犯了一个错误,该代码用于控制加热和摇动液体样品的设备。在没有人为提示的情况下,Coscientist发现了问题,查阅了设备的技术手册,修改了代码,然后再次尝试。
在你阅读这篇文章的时候,一个人工智能驱动的系统就能够自主学习某些获得诺贝尔奖的化学反应,并设计出一个成功的实验室程序来制造它们。人工智能在几分钟内完成了所有这些,并且在第一次尝试中就成功了。
卡内基梅隆大学的化学家和化学工程师Gabe Gomes说:“这是第一次由非有机智能来计划、设计和执行这种由人类发明的复杂反应。”他领导的研究团队组装并测试了基于人工智能的系统。他们将他们的发明命名为“Coscientist”。
Coscientist完成的最复杂的反应在有机化学领域被称为钯催化交叉偶联反应,其发明者因此获得了2010年诺贝尔化学奖,以表彰这些反应在药物开发过程和其他使用精细碳基分子的行业中发挥的巨大作用。
发表在《自然》杂志上的文章中,Coscientist展示的能力表明,人类有可能有效地利用人工智能来加快科学发现的步伐和数量,并提高实验结果的可重复性和可靠性。这个由四人组成的研究小组包括博士生daniel Boiko和Robert MacKnight,他们分别得到了美国国家科学基金会西北大学化学酶合成中心和美国国家科学基金会圣母大学计算机辅助合成中心的支持和培训。
美国国家科学基金会化学部门主任David Berkowitz说:“除了他们的系统所展示的化学合成任务之外,Gomes和他的团队还成功地合成了一种超高效的实验室伙伴,他们把所有部件组合在一起,最终的结果远远超过其部分的总和:它可以用于真正有用的科学目的。”
在 Coscientist 的软件和硅基部件中,最重要的是构成其人工 "大脑 "的大型语言模型。大型语言模型是一种人工智能,可以从海量数据中提取意义和模式,包括文档中包含的书面文本。通过一系列的任务,团队测试和比较了多个大型语言模型,包括GPT-4和OpenAI公司制作的其他版本的GPT大型语言模型。
Coscientist还配备了几个不同的软件模块,团队首先对它们进行了单独测试,然后又对它们进行了联合测试。
“我们试图将科学中所有可能的任务分成小块,然后一点一点地构建更大的图景,”Boiko说,他设计了Coscientist的总体架构和实验任务。“最后,我们把一切都整合到了一起。”
软件模块允许Coscientist做所有研究化学家所做的事情:搜索有关化合物的公开信息,查找和阅读如何控制机器人实验室设备的技术手册,编写计算机代码来进行实验,并分析结果数据以确定哪些有效,哪些无效。
其中一项测试测试了Coscientist准确规划化学程序的能力,这些程序一旦执行,就会产生阿司匹林、对乙酰氨基酚和布洛芬等常用物质。他们也对大型语言模型分别进行了测试和比较,包括两个版本的GPT,其中一个软件模块允许它像人类化学家一样使用谷歌在互联网上搜索信息。然后检查最终的程序,并根据它们是否会导致所需的物质,步骤的详细程度和其他因素进行评分。一些最高分是由具有搜索功能的GPT-4模块获得的,这是唯一一个合成布洛芬的程序质量合格的模块。
Boiko和MacKnight观察到Coscientist能展示“化学推理”能力,Boiko将其描述为使用化学相关信息和先前获得的知识来指导一个人的行为的能力。它使用了以简化分子输入行输入系统(SMILES)格式编码的公开可用的化学信息,这是一种机器可读的表示分子化学结构的符号,并根据在SMILES数据中仔细检查的分子的特定部分修改了实验计划。“这是化学推理的最佳版本,”Boiko说。
进一步的测试纳入了软件模块,允许Coscientist搜索和使用描述控制机器人实验室设备的应用程序编程接口的技术文档。这些测试对于确定Coscientist是否可以将其合成化合物的理论计划转化为计算机代码,从而指导物理世界中的实验室机器人非常重要。
实验室通常使用高科技机器人化学设备,对微小的液体样品进行吸入、喷出、加热、摇动等操作,并精确地反复操作。这种机器人通常是由人类化学家编写的计算机代码控制的,他们可能在同一个实验室,也可能在国家的另一边。
这是第一次用人工智能编写的计算机代码来控制这种机器人。
研究小组给 Coscientist 下达了一些简单的任务,要求它制造一个液体处理机器人,将有色液体分配到一个装有96个排列成网格的小孔的盘子里。它被要求“用你选择的一种颜色涂上每一条线”,“画一条蓝色对角线”以及其他让人想起幼儿园的作业。
从"液体处理机 101 "毕业后,团队让 Coscientist 接触了更多类型的机器人设备。他们与翡翠云实验室(Emerald Cloud Lab)合作,该实验室是一个商业设施,里面摆满了各种自动化仪器,包括分光光度计,可以测量化学样本吸收光的波长。然后,向 Coscientist 展示了一个装有三种不同颜色(红、黄、蓝)液体的盘子,要求它判断盘子里有哪些颜色以及这些颜色在盘子里的位置。
由于Coscientist没有眼睛,因此它编写了代码,以机器人的方式将神秘的色板递给分光光度计,并分析每个孔吸收的光波长,从而确定色板上有哪些颜色及其位置。为了完成这项任务,研究人员不得不给 Coscientist 一点正确的提示,让它思考不同颜色是如何吸收光线的。剩下的就交给人工智能了。
Coscientist的期末考试是将组装的模块和训练组合在一起,以完成团队的命令“perform Suzuki and Sonogashira reactions”的指令,以他们的发明者Akira Suzuki和Sonogashira Kenkichi Sonogashira命名。该反应发现于20世纪70年代,利用金属钯催化有机分子中碳原子之间的键。事实证明,这些反应在生产治疗炎症、哮喘和其他疾病的新型药物方面非常有用。它们还被用于许多智能手机和显示器中有机发光二极管的有机半导体中。这些突破性的反应及其广泛的影响在2010年获得了诺贝尔奖,并被正式授予了Sukuzi, Richard Heck 和Ei-ichi Negishi。
当然,Coscientist之前从未尝试过这些反应。所以,正如作者写前一段所做的那样,它去维基百科上查了一下。
“对我来说,‘eureka’的时刻是看到它提出了所有正确的问题,”MacKnight说,他设计了允许Coscientist搜索技术文档的软件模块。
Coscientist主要在维基百科上寻找答案,同时还有许多其他网站,包括美国化学学会、英国皇家化学学会的网站,以及其他包含描述铃木和Sonogashira反应的学术论文的网站。
在不到四分钟的时间里,Coscientist 就利用团队提供的化学物质设计出了产生所需反应的精确程序。当它试图用机器人在物理世界中执行其程序时,它在编写的代码中犯了一个错误,该代码用于控制加热和摇动液体样品的设备。在没有人为提示的情况下,Coscientist发现了问题,查阅了设备的技术手册,修改了代码,然后再次尝试。
结果包含在一些微小的透明液体样本中。Boiko分析了样品,发现了铃木反应和Sonogashira反应的光谱特征。
当Boiko和MacKnight告诉Gomes,Coscientist是做什么的时候,他表示不相信。“我以为他们是在跟我开玩笑,”他回忆道。但事实并非如此。“就在那时,我突然意识到,好吧,我们有了一个非常新、非常强大的东西。”
有了这种潜在的力量,就需要明智地使用它,防止滥用。Gomes说,了解人工智能的能力和局限性是制定明智的规则和政策的第一步,这些规则和政策可以有效地防止人工智能的有害使用,无论是有意的还是偶然的。
他说:“我们需要对如何部署这些技术负责和深思熟虑。”
Gomes是为美国政府确保人工智能安全使用的努力提供专家建议和指导的几位研究人员之一,例如拜登政府于2023年10月发布的关于人工智能发展的行政命令。
自然界的大小和复杂性几乎是无限的,它包含着无数的发现,等待着我们去发现。想象一下,新的超导材料可以显著提高能源效率,或者可以治愈无法治愈的疾病并延长人类寿命的化合物。然而,获得取得这些突破所需的教育和培训是一段漫长而艰辛的旅程。成为一名科学家很难。
Gomes和他的团队设想,像Coscientist这样的人工智能辅助系统,可以作为一种解决方案,弥补尚未开发的浩瀚自然与训练有素的科学家供不应求这一事实之间的差距。
人类科学家也有人类的需求,比如睡觉和偶尔走出实验室。而人类引导的人工智能可以昼夜不停地“思考”,有条不紊地翻看每一块石头,反复检查实验结果的可重复性。“我们可以让一些东西自主运行,试图发现新现象、新反应、新想法。”
他说:“你还可以大大降低任何领域的进入门槛。”例如,如果一个未受过铃木反应训练的生物学家想以一种新的方式探索铃木反应的用途,他们可以要求Coscientist帮助他们计划实验。
“你可以实现资源和理解的大规模民主化,”他解释说。
Gomes表示,在科学领域,尝试、失败、学习和改进是一个反复的过程,人工智能可以大大加速这一过程。“这本身将是一个巨大的变化。”