OnSIDES 数据库:运用自然语言处理模型从药品标签中挖掘药物不良反应,助力药物安全研究
【字体:
大
中
小
】
时间:2025年04月03日
来源:Med 12.8
编辑推荐:
为解决药物不良反应(ADEs)机器可读数据库稀缺,限制药物安全系统性研究的问题,研究人员开展从药品标签提取 ADEs 构建 OnSIDES 数据库的研究。结果显示该数据库含超 360 万药物 - ADE 对,能助力研究。其意义在于为药物安全研究提供资源。
背景:药物不良反应(ADEs)是美国第四大死因,每年增加数十亿美元医疗成本。然而,ADEs 的机器可读数据库很少,限制了在更广泛、系统层面研究药物安全性的能力。自然语言处理方法(如 BERT 模型)的进展,为从非结构化生物医学文本中准确提取相关信息提供了机会。
方法:研究人员微调 PubMedBERT 模型,从美国食品药品监督管理局(FDA)处方药结构化产品标签文本中提取 ADE 术语,构建了 OnSIDES(标签副作用资源)数据库,这是一个机器友好的药物 - ADE 对数据库。研究人员还用该方法提取儿科特异性 ADEs、标签 “黑框警告” 部分的严重 ADEs,以及英国、欧盟和日本等主要国家药品标签中的 ADEs,构建了补充数据库 OnSIDES - INTL。为展示 OnSIDES 的潜在应用,研究人员利用该数据库预测新的药物靶点和适应症,分析不同药物类别中 ADEs 的富集情况,并从化合物结构预测新的 ADEs。
结果:从标签 “不良反应” 部分提取 ADEs 时,F1分数达到 0.90,受试者工作特征曲线下面积(AUROC)为 0.92,平均精度(AUPR)为 0.95 。OnSIDES 包含从 47211 个标签中提取的 3233 种独特药物成分组合的超 360 万药物 - ADE 对。
结论:OnSIDES 可作为研究和提高药物安全性的综合资源。
资助:R35GM131905 资助给 N.P.T.;T32GM145440 资助给 H.Y.C.;T15LM007079 资助给 U.G.、M.Z. 和 K.L.B.
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号