人工智能赋能荧光团设计:模块化框架开启高效研发新篇

《Nature Communications》:

【字体: 时间:2025年04月17日 来源:Nature Communications

编辑推荐:

  为解决荧光团开发依赖试错实验、性能不足的问题,研究人员开展 “基于人工智能框架促进荧光团设计” 的研究。构建了 FLAME 框架,合成新化合物。这一成果加速了荧光团设计,减少试错成本,推动了相关领域发展。

  在生命科学和医学研究的微观世界里,荧光成像就像一盏明灯,照亮了细胞、组织的奥秘,在基础科研与临床实践中都占据着不可或缺的地位。而荧光团,作为荧光成像的核心元件,其性能的优劣直接决定了成像的质量。多年来,尽管荧光团研究取得了显著进展,但仍面临诸多挑战。一方面,许多现有的荧光团性能不尽人意,无法满足日益增长的研究和临床需求;另一方面,由于荧光团结构与性能之间的关系极为微妙,溶剂效应又错综复杂,导致其开发过程高度依赖耗时费力的试错实验,就如同在黑暗中摸索前行,效率低下且成本高昂。
为了打破这一困境,浙江大学生命科学和健康医学领域的研究人员展开了深入探索。他们的研究成果发表在《Nature Communications》上,为荧光团设计带来了新的曙光。

研究人员为开展此项研究,运用了多种关键技术方法。在数据处理方面,通过广泛收集文献资料和开源数据库数据构建 FluoDB 数据库。在模型构建上,开发了 FLSF 模型用于预测荧光团光物理性质,并引入 Reinvent 4 作为分子生成工具。同时,利用多种传统和机器学习模型进行对比测试,还运用了 TD-DFT 计算进行对照。

研究结果如下:

  • 数据收集和处理:研究人员通过文献调研以及从多个开源数据库中检索数据,构建了 FluoDB 数据库。该数据库包含 35,528 种独特的荧光团和 55,169 个荧光团 - 溶剂对,在分子数量和光学信息丰富度上均优于现有数据库,且不同荧光支架在其中分布相对均匀。通过对 FluoDB 的数据分析,发现不同光物理参数之间存在相关性,如呈明显正相关,分子量与也有一定正相关,同时溶剂对荧光团的光学性质有显著影响。
  • FLSF 的工作流程和预测性能:研究人员在 FluoDB 上测试了多个开源预测模型,发现 ABT - MPNN 在预测方面表现较好,但训练速度较慢。为了更好地对荧光团进行分子表征,设计了一种特殊的分子指纹 - 荧光支架(fluoroscaffold),并基于此构建了 FLSF 模型。在基准测试中,FLSF 在预测的准确性上比 ABT - MPNN 有明显提升,且速度更快,在多溶剂测试集上也表现出最佳的预测性能,同时能高精度预测具有溶剂变色性的荧光团的。与传统的 TD - DFT 计算相比,FLSF 预测的平均绝对误差(MAE)降低了超过 0.2 eV,且计算速度更快,能在不到一秒内提供所有预测结果,而 TD - DFT 的平均计算时间超过 200 CPU 小时。
  • FLSF 的可解释性分析:从分子水平进行 2D - PCA 分析,发现 FLSF 能有效识别不同波长荧光团的结构特征,且荧光支架的整合使这种差异更显著,引入溶剂后数据分布离散度进一步提高,表明 FLSF 对溶剂引起的细微差异敏感。从原子水平以香豆素为例进行分析,发现 FLSF 能掌握香豆素结构修饰与波长变化的规律,对未记录在 FluoDB 中的香豆素衍生物结构修饰也能给出合理预测,具有良好的泛化能力和可靠性。
  • 构建 FLAME 用于荧光团设计:为满足研究人员对新型荧光团设计的实际需求,研究人员构建了 FLAME 框架。该框架整合了多个开源荧光团数据库、预测模型和分子生成器。用户可以在框架中输入感兴趣的分子进行数据库搜索、训练模型,还能利用 Reinvent 4 生成具有预测光学性质的新化合物。
  • 实验评估:以香豆素为基础,利用 FLAME 指导新型香豆素衍生物的开发。通过设定四个光学参数作为评分目标,训练生成模型并筛选出 3,4 - 恶唑并香豆素。研究人员开发了一种新的一锅法合成该化合物,合成了 16 种恶唑并香豆素,对其光学性质进行评估后发现,与 FLSF 的预测结果一致,在香豆素支架的 6 - 或 7 - 位引入氨基会导致红移和增加。其中化合物 3o 在所有测试溶剂中都表现出比 3h 更强的发射,在 HeLa 细胞成像实验中,3o 孵育 30 分钟后能观察到明亮的荧光,显示出其在活细胞成像中的潜力。

研究结论和讨论部分指出,FLAME 框架为荧光团设计提供了高效的解决方案。通过扩充数据库,设计精准快速的预测模型 FLSF,并结合分子生成器,成功合成了具有预期光学性能的新型荧光团,其中一种未报道的香豆素衍生物展现出了出色的荧光性能,有望用于生物成像。这一成果显著降低了荧光团开发过程中试错实验的负担,即使没有荧光或计算专业知识的人员也能轻松使用。此外,FLAME 框架的模块化架构使其能够不断更新数据和算法,未来还可进一步整合合成可及性预测模型和逆合成分析工具,从而更高效地推动荧光团的设计和合成,为生命科学和健康医学领域的研究提供更强大的技术支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号