ACARL:开启基于强化学习的全新药物设计篇章,精准攻克活性悬崖难题

【字体: 时间:2025年04月22日 来源:Journal of Cheminformatics 7.1

编辑推荐:

  在药物研发中,传统模型难以捕捉活性悬崖(Activity Cliff)现象。研究人员开展 Activity Cliff-Aware Reinforcement Learning(ACARL)框架的研究,实验表明该框架能生成高亲和力分子,这为从头药物设计提供了新方法,提升了 AI 在药物发现中的可靠性。

  在当今的药物研发领域,人工智能(AI)的加入本应成为加速进程的强大助力,可实际情况却有些差强人意。传统的药物开发过程漫长又昂贵,而从头药物设计(de novo drug design)作为其中的关键环节,依赖于对复杂结构 - 活性关系(Structure-Activity Relationship,SAR)的精准把握。然而,一个棘手的问题横亘在前 —— 活性悬崖现象。想象一下,两个分子结构仅仅存在微小差异,但其生物活性却可能出现天壤之别,这种在 SAR 中的不连续性就像隐藏在黑暗中的陷阱,让许多 AI 驱动的分子设计算法纷纷 “中招”。现有的机器学习(ML)技术在面对活性悬崖化合物时,预测性能大打折扣,现有的药物设计基准和评分函数也无法准确模拟现实世界药物设计的目标,这无疑严重阻碍了药物研发的脚步。
为了打破这一困境,清华大学的研究人员挺身而出,开展了关于 Activity Cliff-Aware Reinforcement Learning(ACARL)框架的研究。经过一系列严谨的实验,他们发现 ACARL 框架在生成具有高结合亲和力和多样结构的分子方面表现卓越,远超当前最先进的算法。这一成果意义非凡,它成功地将 SAR 原理融入到基于 RL 的药物设计流程中,为从头分子设计提供了一种可靠的新途径,让 AI 在药物发现领域有了更广阔的施展空间。该研究成果发表在《Journal of Cheminformatics》上。

研究人员在开展研究时,主要运用了以下几种关键技术方法:

  1. 定义活性悬崖指数(Activity Cliff Index,ACI):通过比较分子结构相似性和生物活性差异,定量检测分子数据集中的活性悬崖,为模型识别活性悬崖化合物提供依据。
  2. 构建带有对比损失的 RL 框架:基于 “预训练 + 微调” 范式,利用策略梯度损失函数更新模型,同时引入对比损失,优先从活性悬崖化合物中学习,引导模型生成具有理想属性的分子。
  3. 分子对接技术:选用 Quick Vina 2 进行分子对接计算,以此作为针对蛋白质靶点的从头药物设计的评分函数,评估生成分子与靶点的结合亲和力。

下面来看具体的研究结果:

  1. 分子设计与高生物活性:以 5HT1B、5HT2B 和 ACM2 这三个具有高药物研发价值的蛋白质靶点为研究对象,将 ACARL 算法与八个最先进的基线算法进行对比。结果显示,ACARL 在三项基于对接的从头药物设计任务中均表现出色,其生成分子的最佳(Top - 1)和前 100 个平均(Top - 100)对接分数最优,且保持了相当的多样性水平。同时,ACARL 还优于其四个变体,这表明活性悬崖分子在药物设计中比普通分子更为重要,且活性悬崖两侧的高、低得分化合物都对药物设计有益。从 ACARL 运行过程中活性悬崖数量和批次平均得分的变化曲线可以看出,利用活性悬崖后,采样化合物的平均得分迅速上升,这揭示了 ACARL 性能更优的原因。此外,通过对比 ACARL 和预训练模型对一对活性悬崖化合物生成对数似然的差异,发现 ACARL 能更好地刻画活性悬崖。
  2. 分子设计与多属性目标:在实际药物研发中,除了生物活性,分子的其他属性也至关重要。研究人员将对接与定量估计药物相似性(Quantitative Estimate of Drug - likeness,QED)和合成可及性(Synthetic Accessibility,SA)相结合,建立了分子设计的多属性目标(Multi - Property Objectives,MPO)。以线性组合的归一化指标作为评分函数,ACARL 在该任务中表现出良好的灵活性,生成的候选药物在对接和 SA 得分方面表现理想,结构简单且能与目标口袋良好结合,尽管 QED 值不高,但这也反映出这三个靶点的潜在药物可能与现有药物分子差异较大。

在研究结论和讨论部分,ACARL 框架成功地将活性悬崖这一关键的 SAR 特征融入分子生成过程,有效解决了现有药物设计算法忽视 SAR 不连续性的问题。通过实验验证,ACARL 能生成多样且具有高结合亲和力的分子,在药物研发的早期阶段,对于识别具有强目标亲和力和多样结构的先导化合物具有重要意义。然而,ACARL 也存在一些局限性。例如,目前的评估高度依赖分子对接,与体内化合物行为存在差异,需要开发更完善的计算机辅助设计目标;对活性悬崖的定义和机制理解尚不完善,需要整合更多相关知识来优化方法和提高可解释性;同时,在模型架构方面也需要进一步创新,以更好地结合与活性悬崖相关的特定结构信息。尽管如此,ACARL 仍然为 AI 驱动的分子设计和药物发现开辟了新的道路,激励着科研人员继续探索,将科学原理与机器学习的进步相结合,不断提升 AI 在药物设计领域的能力和应用范围,有望开启药物研发的新篇章。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号