编辑推荐:
在药物安全研究中,为解决药物相似性在早期药物不良反应(ADE)检测中缺乏假阳性控制及未在检测时间设定下评估的问题,研究人员开展了基于药物相似性的贝叶斯方法研究。结果显示该方法可加速 ADE 检测并控制假阳性率,对药物安全监测意义重大。
在药物研发和使用的漫长历程中,药物不良反应(Adverse Drug Events,ADE)始终是困扰医学界的一大难题。许多 ADE 在药品上市后的监测中才被发现,而在上市前的临床试验里却 “隐身不见” 。美国食品药品监督管理局(FDA)的不良事件报告系统(FAERS),作为重要的药物警戒数据库,为挖掘 ADE 信号提供了宝贵的数据资源。然而,传统检测 ADE 信号的方法,如比例报告比(PRR)、报告优势比(ROR)等,存在一定的局限性。
随着研究的深入,基于生化药物特性的方法崭露头角。研究发现,具有相似生化特性的药物往往也具有相似的毒性,利用药物相似性网络能够增强真实世界数据挖掘中 ADE 的信号,尤其对那些使用频率较低的新药。但美中不足的是,基于药物相似性的早期 ADE 检测,在挖掘所有新药和 ADE 时,尚未有效控制假阳性,且未在检测时间设定下,对不同类型药物相似性的性能进行明确评估。
为了填补这些研究空白,来自美国印第安纳大学(Department of Biostatistics and Health Data Science, Indiana University)等机构的研究人员,开展了一项关于基于药物相似性的贝叶斯方法用于早期 ADE 检测的研究。该研究成果发表在《Drug Safety》上,为药物安全领域带来了新的曙光。
在研究方法上,研究人员主要运用了以下关键技术:
- 计算药物相似性分数:从化学亚结构(Chem)、药物靶向蛋白序列(Seq)、药物相关基因的生物过程(BP)、分子功能(MF)和细胞成分(CC)这五个维度,计算药物之间的相似性分数。例如,基于 Chem 的相似性分数,是通过比较药物中特定化学亚结构的有无来确定;基于 Seq 的相似性分数,则借助 R 包 Biostrings,考量靶向蛋白序列的相似性 。
- 数据处理与准备:对 FAERS 数据(2004Q1 - 2022Q2)进行处理,去除重复报告,将药物名称标准化为药物成分名称,并使用 MedDRA? 首选术语(PT)作为 ADE 名称 。同时,筛选出 445 种相对新药,构建匹配数据集以控制混杂效应。
- 贝叶斯检测模型:采用贝叶斯方法,利用零假设的后验概率进行假阳性控制。通过优化目标函数,估计先验分布的参数,进而确定 ADE 信号 。
在研究结果方面:
- FAERS 数据分析:研究涉及 445 种相对新药,发现基于化学亚结构的零假设后验概率(PP_Chem)检测出的 ADE 信号比例为 3.7%,其他基于不同相似性分数的方法检测出的信号比例在 3.8 - 4.0% 之间 。且 PP_Chem 在检测药物标签定义的 ADE 时,比参考方法用时更短,如检测卡巴他赛诱导的白细胞减少症和伊洛哌酮诱导的尿失禁,PP_Chem 分别在首次报告后的 12 个季度和 3 个季度就能识别,而参考方法则需要≥3 个季度 。此外,PP_Chem 的 AUC 值更高,尤其在首次报告后的前 3 年表现突出 。
- 额外性能评估分析:在另一个数据集 Clinformatics? 数据分析中,PP_Chem 同样展现出优势,达到相同检测概率的时间更短,AUC 值更高 。在模拟研究中,基于相似性的 PP(PP_sim)能有效控制错误发现率(FDR),且在检测概率、错误遗漏率和 AUC 值等指标上,均优于参考方法 。
综合研究结论和讨论部分,基于药物相似性的贝叶斯 ADE 检测方法,具有重要的意义。它能够加速 ADE 的检测,同时有效控制假阳性率,在挖掘新药和 ADE 方面表现出色。不同类型的药物相似性在高通量 ADE 挖掘中性能相当,意味着药物相关的化学结构、蛋白质和基因在预测 ADE 方面具有相似的潜力。
然而,该研究也存在一定的局限性。FAERS 分析可能受到报告不足、选择性报告和不公平抽样的影响;基于 MedDRA? PT 术语的分析,虽分辨率高,但可能影响临床相关性和统计效力;自动高通量挖掘可能面临先验分布不理想、比较和先验 - 数据冲突等问题;ADE 基准可能不够全面;模拟设置与真实临床场景存在偏差。尽管如此,该研究为药物安全领域提供了新的思路和方法,未来有望通过进一步研究,完善药物相似性的应用,开发更精准的 ADE 检测模型,推动药物安全监测技术的发展,保障公众用药安全。