基于简约图可视化先导优化系列:突破传统,助力药物研发新征程

【字体: 时间:2025年04月25日 来源:Journal of Cheminformatics 7.1

编辑推荐:

  在药物研发的先导优化(LO)阶段,传统 Markush 结构和 R - 基团表在展示结构 - 活性关系(SAR)时存在局限。研究人员开展基于简约图(RG)表示分子的研究,分析 GSK 的 LO 数据集,成功识别不同化合物系列。该研究为药物研发提供新视角,意义重大。

  在药物研发的漫长道路上,先导优化(Lead Optimization,LO)阶段至关重要。这一阶段旨在改善那些已被发现对特定靶点有活性的化合物的理化性质,在保留或提高活性的同时,优化其吸收、分布、代谢、排泄和毒性(ADMET)等特性 。通常,研究人员会通过迭代修改分子不同位置的取代基,来探寻结构 - 活性关系(Structure-Activity Relationship,SAR),从而找到性能更优的化合物。这就使得 LO 数据集往往包含数百种围绕少量核心支架构建的分子。
目前,在药物化学文献中,LO 系列通常以 Markush 结构和相关的 R - 基团表来呈现。Markush 结构展示了系列化合物共有的核心支架,R - 基团则表示探索过的可变点,相关的 R - 基团表列出了系列中单个分子的取代基组合以及化合物的性质。这种方式虽然能直观地展示 SAR,但也存在不少问题。例如,基于最大公共子结构方法的自动化方法,如 SAR 地图,无法考虑核心结构本身的小变化,也难以处理数据中存在多个核心的情况。这就如同在复杂的分子迷宫中,传统方法难以准确识别那些结构相似但又存在细微差异的化合物系列,导致对 SAR 的解读变得困难重重。
为了解决这些问题,英国谢菲尔德大学信息学院和葛兰素史克(GlaxoSmithKline,GSK)的研究人员 Jessica Stacey、Baptiste Canault、Stephen D. Pickett 和 Valerie J. Gillet 开展了一项重要研究。他们提出了一种基于简约图(Reduced Graph,RG)描述分子的自动化方法来表示 LO 系列,并将研究成果发表在《Journal of Cheminformatics》上。
该研究主要运用了以下关键技术方法:首先是生成 RG,通过识别分子中的功能基团(如氢键供体 HBD、氢键受体 HBA 等)、环(分为芳香环和脂肪环,并标注其氢键特性)以及分析非环部分,将原子组合成 RG 节点,再根据原始结构中的键连接节点,最终得到分子的 RG 表示。其次是生成 RG 核心,通过迭代计算 RGs 之间的最大公共子结构(MCS),并结合用户定义的相似性阈值和最小 RG 核心大小这两个参数,确定 RG 核心。最后是将分子分配到 RG 核心,通过考虑分子与 RG 核心的映射关系,利用节点拓扑距离图和取代基拓扑距离图等方法,解决映射中的歧义问题。
在研究结果部分:
  • RG 核心的提取及分析:研究人员对来自 GSK 的 P2X7受体拮抗剂的数据集进行分析。结果显示,随着最小核心大小增加,找到的 RG 核心数量增多;而相似性阈值对 RG 核心数量影响较小。最终选择最小 RG 核心大小为 5、相似性阈值为 0.5 的参数组合,得到 13 个 RG 核心。
  • 主要 RG 核心的特征:对九个最具代表性的 RG 核心进行深入研究发现,不同的 RG 核心代表了不同的化合物系列。例如,RG 核心 1 代表了超过 50% 的分子,但未能包含分子中的关键杂环部分;RG 核心 2 则更能体现 LO 系列的特征,它包含了来自焦谷氨酸酰胺的结构,反映了数据探索背后的动机;RG 核心 3 与前两者相关,但侧重点不同,聚焦于中央乙酰胺基团和杂环;RG 核心 4 代表了乙酰胺基团被羰基取代的化合物系列,且包含两个不同的脂肪杂环变体。此外,还有多个 RG 核心分别代表了不同子集的化合物系列。
  • 结构 - 活性关系分析:通过对核心代表的子结构进行表格展示,研究人员可以快速查看系列中每个位置的子结构变化,并从中发现一些结构 - 活性关系线索。比如,在 RG 核心 2 代表的分子中,含有 R 吡咯烷环的分子与含有 S 吡咯烷环的分子相比,其活性存在差异;同时,通过比较不同 RG 核心,发现 RG 核心 5 中对杂环的探索相对较少。
    在研究结论和讨论部分,该研究提出的方法成功地将数据集中的化合物组织成不同的化合物系列,每个系列由 RG 核心表示。与传统的 Markush 结构和 SAR 表相比,RG 表示能够将具有不同子结构但具有相同环 / 非环结构形式和兼容氢键特征的分子聚集在一起,充分考虑了化合物中的小亚结构差异,还能从代表 LO 程序不同阶段的数据集提取不同系列。通过将 RG 核心可视化为饼图等图形元素,用户可以直观地看到化合物系列内的主要可变点,了解分子各区域的探索程度,还能深入查看单个子结构及其相关分子的活性值。这一研究成果为药物研发项目团队提供了一种无偏见的方式来审查 SAR,有助于评估模型对化合物子类的预测性,也能帮助理解设计工作流程的输出,为药物研发开辟了新的道路,具有重要的理论和实践意义。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号