-
生物通官微
陪你抓住生命科技
跳动的脉搏
一种能够在新环境中导航、寻找奖励、绘制地标和克服障碍的人工智能
【字体: 大 中 小 】 时间:2024年06月27日 来源:AAAS
编辑推荐:
科学家们根据海蛞蝓觅食的大脑回路,赋予人工智能简单的联想学习规则,并给它增强更好的情景记忆,就像章鱼一样,他们已经制造出了一种能够在新环境中导航、寻找奖励、绘制地标和克服障碍的人工智能。
通过赋予人工智能简单的联想学习规则,这些规则基于允许海蛞蝓觅食的大脑回路,并增强它更好的情景记忆,就像章鱼一样,科学家们已经建立了一个可以在新环境中导航、寻找奖励、绘制地标和克服障碍的人工智能。
据《神经计算》(Neurocomputing)杂志报道,这种新方法使人工智能能够探索和收集所需的信息,以扩大其空间和时间意识,在工作中学习的同时扩大其知识库,伊利诺伊大学香槟分校(University of Illinois Urbana-Champaign)的博士后研究员叶卡季琳娜·格里布科娃(Ekaterina Gribkova)说。她与伊利诺伊大学分子和综合生理学名誉教授哈诺·吉列(Rhanor Gillette)共同领导了这项研究。在农业和生物工程教授Girish Chowdhary的支持下。
格里布科娃说:“这从本质上使我们的人工智能比目前的人工智能更像动物。”“我们正在学习如何从像海蛞蝓的记忆这样非常非常简单的东西,变成像我们这样的东西。”
她说,这种新方法还有一个额外的优势,那就是比在人工智能执行基本功能之前用大量数据对其进行预训练的标准方法更有效。
Gribkova说,通过添加一个记忆模块,允许人工智能保留过去事件的信息,非常简单的空间学习可以扩展到更复杂的学习。
“我们可以使用相同类型的联想来学习,例如,运动行为的序列,或者如何绘制社交网络,甚至是语言问题的解决,”她说。“在空间领域学习,实际上在环境中导航,走捷径,我们的记忆模块能够做到的,可以很好地应用于更抽象的概念。”
为了实现这一目标,研究小组在他们之前的工作基础上,模拟了一种胸膜鳃海蛞蝓的决策神经回路,这个项目被称为“赛博蛞蝓”。他们将这种模拟生物命名为阿西莫夫,以科幻作家艾萨克·阿西莫夫的名字命名。阿西莫夫探讨了人类社会中机器人的安全问题和伦理问题。
研究人员给ASIMOV编程,让它监控自己的内部状态,并寻求满足和奖励。当它“饿了”,在一段时间没有吃东西之后,阿西莫夫通过反复试验学会了选择有营养的食物而不是有害的食物。当研究人员在ASIMOV的选择范围内添加一种令人陶醉的模拟药物时,ASIMOV表现得好像上瘾了,即使它没有营养价值也会追逐这种药物。
然而,ASIMOV活在当下,虽然它可以从经验中学习,但它的记忆和整合过去经验信息的能力是有限的。因此,格里布科娃为情景记忆添加了一个计算模块,称为特征关联矩阵(Feature Association Matrix),以海马体的结构和功能为模型,海马体是大脑中对学习和记忆至关重要的区域。这项工作还得到了对章鱼大脑网络驱动行为的研究的启发。研究人员称ASIMOV-FAM代理为“网络章鱼”。
“情景记忆编码了过去事件和经历的空间和时间背景,”作者写道。他们说,这是自然智能的基本组成部分,而目前大多数人工智能模型都缺乏这一点。
在新的研究中,ASIMOV-FAM探索了一个具有各种地标的模拟环境,其中一些附有奖励。Gribkova通过权衡ASIMOV所采取的每个途径的相对回报,专注于可能加强或削弱的两两关联。它被设定为寻求新奇和奖励。
“ASIMOV代理使用FAM形成的认知地图来了解其空间环境,”吉列说。“它可以生成新的路径和捷径,让玩家更有效地穿越环境,获得更大的奖励。这是有效的空间推理。”
研究人员表示,他们希望利用这种新方法来创造一种更高效、更先进的人工智能,它可以执行空间导航以外的各种任务。
吉列表示:“我们希望ASIMOV-FAM能够适应更抽象、非空间的应用,例如,增强像ChatGPT这样的大型语言模型,以更有效地计算和解决问题,同时减少尺寸和训练要求。”
格里布科娃说:“我们认为,如果我们能更多地采用自下而上的方法,我们就能构建出一个不需要那么多数据的人工智能,它的适应行为和创造力更像动物,而且能自己学习更多东西。”“从本质上讲,我们认为先进的人工智能更像孩子一样学习。”
吉列和格里布科娃是美国国家超级计算应用中心人工智能创新中心的附属机构,也是美国大学神经科学项目的附属机构。吉列还是贝克曼高级科学技术研究所和伊利诺斯州卡尔·r·伍斯基因组生物学研究所的教授。