编辑推荐:
研究人员针对药效团引导药物发现中深度学习应用少的问题,开展 DiffPhore 模型研究,提升了预测及筛选能力,推动 AI 药物研发。
在药物研发的广阔领域中,人工智能(AI)正逐渐崭露头角,渗透到药物发现的各个关键阶段,为这一传统领域带来了新的生机与活力。AI 在先导化合物发现与优化、靶点识别以及临床前和临床研究等方面都取得了显著进展,尤其在结构引导的药物发现中,深度学习(DL)算法更是展现出强大的能力,能够高效完成结合模式生成、结合亲和力预测和分子生成等核心任务。
然而,药效团作为药物发现中至关重要的概念,其在深度学习领域的应用却相对滞后。药效团是关键化学相互作用的抽象表示,它以独特、简洁且包含位置信息的特点,在药物发现,特别是早期阶段,发挥着不可替代的作用。尽管目前已经有多种基于药效团的药物发现工具,但将深度学习技术应用于药效团引导的药物发现仍然较为罕见。造成这种现状的原因是多方面的,其中缺乏高质量的数据集以及能够有效捕捉稀疏药效团特征的复杂算法是主要障碍。
为了突破这些困境,来自四川大学的研究人员开展了一项极具创新性的研究。他们提出了一种名为 DiffPhore 的知识引导扩散框架,用于 “即时” 3D 配体 - 药效团映射(3D ligand - pharmacophore mapping,LPM)。这一研究成果发表在《Nature Communications》上,为药物研发领域带来了新的希望和方向。
在这项研究中,研究人员采用了多种关键技术方法。首先,他们构建了两个 3D 配体 - 药效团对的数据集 CpxPhoreSet 和 LigPhoreSet。CpxPhoreSet 来源于实验测定的蛋白质 - 配体复合物结构,包含真实但有偏差的配体 - 药效团映射场景;而 LigPhoreSet 则是通过考虑药效团和配体的多样性,从能量有利的配体构象中生成,涵盖了更广泛的完美匹配的配体 - 药效团对。这两个数据集的互补特性为开发高效的深度学习模型奠定了坚实基础。其次,DiffPhore 框架由知识引导的 LPM 编码器、基于扩散的构象生成器和校准构象采样器三个主要模块组成。该框架通过融入药效团类型和方向匹配规则,引导配体构象与药效团模型的对齐,同时利用校准采样减少扩散模型中固有的偏差。
下面来详细看看研究结果:
- 互补的 3D 配体 - 药效团对数据集:研究人员发布了 CpxPhoreSet 和 LigPhoreSet 两个数据集。CpxPhoreSet 包含 15,012 个配体 - 药效团对,来自实验的蛋白质 - 配体复合物结构;LigPhoreSet 则有 840,288 个配体 - 药效团对,从大量化合物中筛选构建。通过分析发现,LigPhoreSet 中的配体化学多样性更广,药效团特征更丰富,而 CpxPhoreSet 中的配体 - 药效团对匹配度存在差异。这两个数据集的特性使其分别适用于模型训练的不同阶段,为后续研究提供了有力支持。
- DiffPhore 能准确预测配体结合构象:研究人员将 DiffPhore 与传统药效团程序和其他构象生成工具进行对比评估。在 PDBBind 测试集和 PoseBusters 集上,DiffPhore 在生成配体结合构象方面表现出色,具有较高的成功率,且受初始构象数量和多样性的影响较小。同时,DiffPhore 生成的构象在化学和能量上更合理,与给定的药效团模型匹配度更高。此外,与传统对接工具相比,DiffPhore 在处理蛋白质冲突方面表现相当,且能生成更多分子内合理的构象。
- DiffPhore 在先导化合物发现和靶点垂钓中表现卓越:研究人员利用 DiffPhore 对多个靶点进行虚拟筛选,评估其在先导化合物发现和靶点垂钓中的能力。在针对不同靶点的筛选实验中,DiffPhore 能够有效区分活性和诱饵配体,在多个评估指标上优于传统药效团工具,与领先的对接工具相当。在靶点垂钓实验中,DiffPhore 对特定化合物的靶点排名表现出色,证明了其在该领域的潜力。
- DiffPhore 识别出人类谷氨酰胺环化酶的先导化合物:人类分泌型谷氨酰胺环化酶(sQC)和高尔基体驻留型谷氨酰胺环化酶(gQC)是治疗多种疾病的有吸引力的靶点。研究人员基于 sQC 催化底物的结合模式构建药效团模型,利用 DiffPhore 对约 140 万种化合物进行虚拟筛选,发现了 7 种对 sQC 和 gQC 具有抑制活性的化合物。通过共结晶分析,揭示了这些化合物与 sQC 的结合模式,进一步验证了 DiffPhore 在发现高质量先导化合物方面的有效性。
综合来看,这项研究具有重要意义。DiffPhore 作为首个用于 LPM 任务的深度学习模型,为基于药效团的药物发现技术发展提供了新的思路和方法。研究中构建的数据集不仅有助于开发针对 LPM 任务的高质量模型,还可能为其他相关任务的深度学习模型开发提供支持。此外,DiffPhore 在预测结合构象和虚拟筛选方面的出色表现,为药物研发提供了更高效、准确的工具,有望加速新药的开发进程。然而,研究人员也指出,未来还需要进一步改进算法,提高计算效率和准确性,以应对更复杂的配体构象预测挑战。相信随着研究的不断深入,DiffPhore 以及相关技术将在药物研发领域发挥更大的作用,为人类健康事业做出重要贡献。