基于大语言模型的 ChatChemTS:开启 AI 辅助分子设计新征程

《Journal of Cheminformatics》:Large language models open new way of AI-assisted molecule design for chemists

【字体: 时间:2025年03月25日 来源:Journal of Cheminformatics 7.1

编辑推荐:

  为解决 AI 分子设计工具使用门槛高的问题,研究人员开发 ChatChemTS,助力分子设计,推动 AI 在化学领域应用。

  在当今科技飞速发展的时代,人工智能(AI)已经渗透到各个领域,化学领域也不例外。AI - 基于的分子设计技术成为了设计具有特定功能分子的热门方法,在材料设计和药物发现等诸多领域都展现出了巨大的潜力。比如在材料设计方面,通过 AI 分子生成器设计出的荧光和光功能分子,经过实验验证能展现出预期的性能;在药物发现领域,新的质子泵抑制剂和抗纤维化抑制剂等也借助 AI 技术成功设计出来。
然而,这项看似前景无限的技术在实际应用中却面临着重重挑战。各类 AI - 基于的分子生成器虽然不断朝着实际应用迈进,但它们的有效使用需要专业的 AI 知识和技能。对于化学、制药等行业的研究人员来说,设计合适的奖励函数(用于引导分子生成器生成具有特定属性的分子)以及根据不同分子生成器的特点配置条件,都需要掌握机器学习(ML)等专业技能,这就如同横亘在他们面前的一道高门槛,阻碍了 AI 分子设计技术的广泛应用。

为了攻克这一难题,来自横滨城市大学(Graduate School of Medical Life Science, Yokohama City University)、理化学研究所(RIKEN Center for Integrative Medical Sciences 等多个机构的研究人员 Shoichi Ishida、Tomohiro Sato、Teruki Honma 和 Kei Terayama 等开展了一项极具创新性的研究。他们开发了一种基于大语言模型(LLM)的聊天机器人 ChatChemTS,旨在帮助用户仅通过聊天互动就能利用 AI - 基于的分子生成器 ChemTSv2 进行新分子设计,该研究成果发表在《Journal of Cheminformatics》上。

研究人员在开发 ChatChemTS 时,运用了多种关键技术方法。首先,采用了 ReAct 框架,这个框架能让 LLM 将推理过程与外部环境中的任务特定行动相结合,从而实现通用任务的解决。同时,使用了 OpenAI 的 GPT - 4(gpt - 4 - 0613)作为 LLM,并借助 LangChain 来实现 ReAct 框架。此外,利用 FastAPI 进行后端操作,Streamlit 和 Chainlit 用于前端实现,还通过 Docker 将计算环境容器化,使用 Docker Compose 实现应用的自动部署。

下面来看看具体的研究结果。

  1. ChatChemTS 的实现:ChatChemTS 基于 LLM 开发,采用 ReAct 框架,配备了一系列预定义工具,如奖励生成器、预测模型构建器、配置生成器、ChemTSv2 应用程序编程接口(API)、分子生成分析器和文件写入工具。为了确保高质量的回复,多个 LLM 被用于不同的特定角色。整个平台通过多种技术协作实现,并且进行了容器化部署,方便用户使用。
  2. 发色团设计:研究人员以设计具有特定吸收波长的发色团为例展示 ChatChemTS 的功能。首先,使用预测模型构建器工具创建用于预测吸收波长的 ML 模型,训练数据集包含 50000 个分子,其吸收波长通过密度泛函理论(DFT)在 B3LYP/6 - 31G * 水平计算得到。接着,通过聊天设计奖励函数和配置,设定目标吸收波长为 600nm 等条件,然后执行 ChemTSv2,最后利用分析工具进行结果分析。结果显示,ChatChemTS 成功设计出了预测吸收波长约为 600nm 的分子。
  3. EGFR 抑制剂设计:在设计表皮生长因子受体(EGFR)抑制剂的任务中,同样利用 ChatChemTS 的预测模型构建器,根据 UniProt ID P00533 从 ChEMBL 数据库中检索相关分子数据并预处理,构建用于预测抑制活性的 ML 模型。之后,通过聊天设计奖励函数和配置,旨在最大化预测的抑制活性和 QED 分数等,执行 ChemTSv2 并分析结果。最终,ChatChemTS 成功设计出预测 pChEMBL 值高于 7 且 QED 分数约为 0.7 的分子,并且通过对比实验,证明了在奖励函数中结合抑制活性和 QED 分数的有效性。

在研究结论和讨论部分,ChatChemTS 在辅助用户使用 AI 分子生成器方面取得了显著成果,成功协助用户完成了设计奖励函数、设置配置、执行分子生成器和分析结果这四个关键操作。然而,研究也发现了一些有待改进的地方。例如,在设计 EGFR 抑制剂时,生成的分子缺乏常见激酶抑制剂的主要铰链结合支架,后续可以通过引入新的奖励函数来解决这一问题。此外,ChatChemTS 目前仅支持 ChemTSv2 这一种分子生成器,未来计划增加对更多分子生成器的支持;同时,虽然理论上可以支持多种 LLM 的切换,但目前尚未实现。另外,还需要开发验证系统来确保 LLM 正确解释用户请求,优化奖励设计功能,增加分类模型等功能以提升用户体验,建立更强大的软件基础等。

总的来说,ChatChemTS 的开发为化学领域的分子设计带来了新的曙光,它极大地降低了 AI 分子设计技术的使用门槛,让更多化学研究人员能够轻松利用这一技术进行创新研究。尽管还存在一些需要完善的地方,但它的出现无疑为 AI 在化学和健康医学领域的深度融合奠定了坚实的基础,有望推动药物研发、材料设计等相关领域取得更大的突破,为人类的健康和科技发展做出重要贡献。

涓嬭浇瀹夋嵎浼︾數瀛愪功銆婇€氳繃缁嗚優浠h阿鎻ず鏂扮殑鑽墿闈剁偣銆嬫帰绱㈠浣曢€氳繃浠h阿鍒嗘瀽淇冭繘鎮ㄧ殑鑽墿鍙戠幇鐮旂┒

10x Genomics鏂板搧Visium HD 寮€鍚崟缁嗚優鍒嗚鲸鐜囩殑鍏ㄨ浆褰曠粍绌洪棿鍒嗘瀽锛�

娆㈣繋涓嬭浇Twist銆婁笉鏂彉鍖栫殑CRISPR绛涢€夋牸灞€銆嬬數瀛愪功

鍗曠粏鑳炴祴搴忓叆闂ㄥぇ璁插爞 - 娣卞叆浜嗚В浠庣涓€涓崟缁嗚優瀹為獙璁捐鍒版暟鎹川鎺т笌鍙鍖栬В鏋�

涓嬭浇銆婄粏鑳炲唴铔嬬櫧璐ㄤ簰浣滃垎鏋愭柟娉曠數瀛愪功銆�

相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 急聘职位
    • 高薪职位

    知名企业招聘

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号