HepatoToxicity Portal(HTP):整合药物性肝毒性知识库与预测模型,助力药物研发

【字体: 时间:2025年04月09日 来源:Journal of Cheminformatics 7.1

编辑推荐:

  为解决药物研发中肝毒性预测难题,如信息分散、缺乏标准、数据异质性等,研究人员开展了 HepatoToxicity Portal(HTP)的研究。他们整合数据构建知识库(HTP-KB)和预测模型(HTP-Pred),模型表现优异,为药物研发提供了有力支持。

  在药物研发的漫长征程中,失败的阴影始终笼罩。据统计,每个研发阶段的成功率都低于 10%,而药物毒性是导致这一现象的重要原因之一。肝脏作为药物代谢和解毒的关键器官,极易受到药物的损伤,药物性肝损伤(Drug-induced liver injury,DILI)甚至成为美国三级护理中心急性肝衰竭的主要诱因,超过半数的病例与之相关。
目前,虽然已经有一些关于 DILI 的知识资源,如 Liver Toxicity Knowledge Base(LTKB)、DILIrank 数据集、LiverTox 等,但这些数据库的覆盖范围有限,仅针对市场上的药物。实验数据虽然重要,但存在数据格式不便于提取等问题。同时,现有的预测模型和网络平台也存在各种不足,要么缺乏深入的肝毒性分析,要么预测性能有待提高。

为了攻克这些难题,来自韩国多个机构的研究人员展开了深入研究,最终成果发表在《Journal of Cheminformatics》上。

研究人员主要采用了以下关键技术方法:首先,从九个公共资源收集数据,经过 PubChem Compound Identifiers(CIDs)标注、手动筛选和分类等步骤,构建了 HTP-KB 知识库;其次,利用预训练的图神经网络(Graph Neural Network,GNN)模型 MolCLR,并在 HTP-KB 数据集上进行微调,开发了肝毒性预测模型 HTP-Pred;此外,通过特定的计算方法确定了肝毒性基团(hepato-toxicophores)。

研究结果如下:

  • HTP-KB 内容及统计:HTP-KB 整合了九个数据库的数据,共包含 8306 种化合物,其中 2260 种有临床证据支持,6472 种有体外证据支持。通过 MedDRA 术语注释,发现‘Hepatocellular damage and hepatitis NEC’相关 HLT 术语占比最大。整体肝毒性评分呈正偏态分布,共有 5379 种化合物得分呈阳性,2843 种得分呈阴性123
  • HTP-Pred 模型开发:对 HTP-KB 数据集进行预处理,重新标记数据并解决标签冲突问题。以 GCN 或 GIN 为骨干网络对 MolCLR 进行微调,得到 HTP-Pred 模型。该模型在预测肝毒性方面表现优异,受试者工作特征曲线下面积(Area under the receiver operating characteristic curve,AUROC)达到 0.761,优于现有方法456
  • 肝毒性基团计算:通过基于梯度的方法计算原子对肝毒性预测的贡献,定义了肝毒性基团。利用 SMiles ARbitrary Target Specification(SMARTS)模式搜索化合物中的子结构,根据原子贡献得分确定关键肝毒性基团,为理解分子特征与肝毒性的关系提供了依据78
  • HTP 数据库和网络服务器实现:以 PubChem CID 为主要标识符构建数据库,通过 SQL 文件整合数据。网络界面设计友好,提供搜索、统计、下载等功能,用户可方便地获取化合物的肝毒性信息和预测结果910

在讨论和结论部分,HTP 的优势显著。HTP-KB 内容广泛且经过专家整理,独特的评分系统为研究人员提供了全面的肝毒性化合物信息。HTP-Pred 模型性能卓越,还能识别肝毒性基团,有助于药物设计和优化。然而,模型也存在一些局限性,如可能存在来自合并数据库和模型自身的偏差。未来,HTP 将不断更新和完善,有望进一步提高预测能力,扩大数据库覆盖范围,为毒理学和药理学研究做出更大贡献。它为评估化合物的肝毒性风险提供了全面的资源,将有力推动药物安全评估和生物医学研究的发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号