精准肿瘤学药物反应预测评估新策略:突破困境,迈向精准医疗新时代

【字体: 时间:2025年03月15日 来源:Journal of Cheminformatics 7.1

编辑推荐:

  研究人员针对药物反应预测(DRP)评估问题,提出新验证协议,为精准肿瘤学助力。

  在癌症治疗领域,精准肿瘤学致力于依据患者的独特特征,为其精准匹配合适的药物及剂量,从而实现个性化的高效治疗,这无疑是当代医疗的重要发展方向。然而,肿瘤的复杂性却给这一目标的实现带来了重重阻碍。肿瘤具有高度的异质性,其内部存在多样的细胞亚群,这些亚群对药物的反应各不相同,有的甚至相互冲突;同时,肿瘤还会通过各种机制产生耐药性,即便进行全面的分子检测,也难以精准把握肿瘤在遗传、表观遗传以及与微环境相互作用过程中的动态变化。
为了克服这些难题,科研人员迫切需要可靠的临床前模型,于是包含多种癌细胞系药物反应测量数据的大型数据集应运而生,像美国国家癌症研究所 60 细胞系(NCI60)、癌症细胞系百科全书(CCLE)、癌症药物敏感性基因组学(GDSC)和癌症治疗反应门户(CTRP)等。基于这些数据,研究人员构建了药物反应预测(Drug Response Prediction,DRP)模型,期望能借助该模型预测不同细胞系对药物的反应,加速抗癌药物的研发进程。

但目前 DRP 模型的发展遇到了瓶颈。一方面,现有模型的验证方法存在缺陷,常用的评估策略容易受到数据集偏差的干扰,无法准确衡量模型在不同药物和细胞系上的泛化能力,导致模型可能通过利用数据结构和评估指标的漏洞获得高分,出现 “规范博弈(specification gaming)” 现象,使得看似良好的性能指标并不能代表模型真正的预测能力。另一方面,大多数 DRP 方法以半数抑制浓度(IC50)作为预测标签来衡量药物反应,然而 IC50的值与药物测试时的浓度范围密切相关,特别是最大测试浓度(MC),这使得模型难以推广到新药物,甚至无法推测新药物的预期浓度范围。

为了解决这些问题,都灵大学(University of Torino)等机构的研究人员展开了深入研究。他们的研究成果发表在《Journal of Cheminformatics》上,为 DRP 领域带来了新的突破。

研究人员在此次研究中运用了多种关键技术方法。首先,选用 GDSC v.6.0 等多个数据集,这些数据集涵盖了丰富的癌细胞系、药物以及多组学数据,为研究提供了充足的数据支持。其次,开发了一种新型的多组学预测方法 NxtDRP,该方法基于 NXTfusion 非线性数据融合库,能够灵活测试不同类型组学数据的相关性。同时,通过将药物的简化分子输入线输入系统(SMILES)表示转化为分子图,并利用图神经网络(Graph NN)进行处理,将药物结构信息融入模型。此外,还引入了实体关系(ER)图来整合细胞系、药物、蛋白质和基因等多方面信息,通过优化损失函数来训练模型。

下面来看看具体的研究结果:

  • 超越全局指标:稳健模型评估的聚合策略:研究人员提出了一种全新的评估框架,该框架包含三种聚合策略,即全局(Global)、固定药物(Fixed-Drug)和固定细胞系(Fixed-Cell Line)策略。与传统仅使用全局评估的方法不同,新框架从多个角度审视预测性能。全局策略计算整个测试集的性能指标;固定药物策略针对每个药物单独计算性能指标后取平均值,以此分析模型对不同细胞系药物反应的区分能力;固定细胞系策略则针对每个细胞系计算性能指标后取平均,用于评估模型在固定细胞系上对不同药物的区分能力。研究发现,不同聚合策略的性能表现与数据集特征以及训练测试集的划分策略紧密相关,仅依赖全局聚合策略可能会导致预测性能被高估。
  • 新型非线性多组学药物反应预测方法:研究人员开发的 NxtDRP 模型,通过在 GDSC 数据集上与 tCNN 和 GraphDRP 等方法进行对比测试,展示了不同组学数据整合对预测性能的影响。在随机拆分(Random Splits)验证中,虽然 NxtDRP 等模型在全局性能上表现良好,但多组学数据的加入并未显著提升性能,这表明在这种验证策略下,药物反应数据本身已能满足模型学习需求,额外的组学数据价值有限。在未见细胞系(Unseen cell lines)验证中,即便不含多组学信息的 NxtDRPMT模型也能在全局性能上达到较高水平,但这一结果具有误导性,因为其在固定药物性能评估中表现很差,说明模型实际上无法区分未见细胞系的药物反应。而加入多组学关系的 NxtDRPMT+EX+PR模型在固定药物设置下性能提升明显。在未见药物(Unseen drugs)验证中,预测 IC50值是一个极具挑战性的任务,当前缺乏可靠的计算方法。研究发现,现有 DRP 模型在该验证策略下表现不佳,且模型性能受 IC50值高变异性的影响较大。同时,研究还发现最大药物浓度(MC)与 IC50值高度相关,仅利用 MC 作为特征的 DummyMC 模型在全局预测聚合中甚至超越了其他 DRP 模型。

在讨论部分,研究人员强调了此次研究的重要意义。一方面,他们指出 IC50作为预测标签存在严重局限性,建议使用剂量反应曲线下面积(Area Under the Dose-Response Curve,AUDRC)替代 IC50AUDRC 能够有效消除药物浓度范围对评估药物疗效的影响,更准确地反映药物与细胞的相互作用,在临床应用中也具有重要价值。另一方面,研究人员提出的新型验证协议,将 AUDRC 与固定药物、固定细胞系聚合策略相结合,能够更准确地评估 DRP 模型的泛化能力,避免模型因数据集偏差而产生误导性的高评分。这一验证协议为开发更可靠的 DRP 模型奠定了基础,有望推动精准肿瘤学领域的临床前药物研发,让癌症治疗更加精准、高效。

总的来说,这项研究通过深入剖析 DRP 模型在评估和预测标签方面存在的问题,提出了切实可行的解决方案,为精准肿瘤学中药物反应预测的发展指明了新方向,具有重要的理论和实践意义 。<【《精准肿瘤学药物反应预测评估新策略:突破困境,迈向精准医疗新时代》】【研究人员针对药物反应预测(DRP)评估问题,提出新验证协议,为精准肿瘤学助力。】【精准肿瘤学 | 药物反应预测 | 深度学习 | 验证协议 | IC50|AUDRC | 细胞系 | 药物 | 多组学数据 | 实体关系图】【国外】【在癌症治疗领域,精准肿瘤学致力于依据患者的独特特征,为其精准匹配合适的药物及剂量,从而实现个性化的高效治疗,这无疑是当代医疗的重要发展方向。然而,肿瘤的复杂性却给这一目标的实现带来了重重阻碍。肿瘤具有高度的异质性,其内部存在多样的细胞亚群,这些亚群对药物的反应各不相同,有的甚至相互冲突;同时,肿瘤还会通过各种机制产生耐药性,即便进行全面的分子检测,也难以精准把握肿瘤在遗传、表观遗传以及与微环境相互作用过程中的动态变化。

为了克服这些难题,科研人员迫切需要可靠的临床前模型,于是包含多种癌细胞系药物反应测量数据的大型数据集应运而生,像美国国家癌症研究所 60 细胞系(NCI60)、癌症细胞系百科全书(CCLE)、癌症药物敏感性基因组学(GDSC)和癌症治疗反应门户(CTRP)等。基于这些数据,研究人员构建了药物反应预测(Drug Response Prediction,DRP)模型,期望能借助该模型预测不同细胞系对药物的反应,加速抗癌药物的研发进程。

但目前 DRP 模型的发展遇到了瓶颈。一方面,现有模型的验证方法存在缺陷,常用的评估策略容易受到数据集偏差的干扰,无法准确衡量模型在不同药物和细胞系上的泛化能力,导致模型可能通过利用数据结构和评估指标的漏洞获得高分,出现 “规范博弈(specification gaming)” 现象,使得看似良好的性能指标并不能代表模型真正的预测能力。另一方面,大多数 DRP 方法以半数抑制浓度(IC50)作为预测标签来衡量药物反应,然而 IC50的值与药物测试时的浓度范围密切相关,特别是最大测试浓度(MC),这使得模型难以推广到新药物,甚至无法推测新药物的预期浓度范围。

为了解决这些问题,都灵大学(University of Torino)等机构的研究人员展开了深入研究。他们的研究成果发表在《Journal of Cheminformatics》上,为 DRP 领域带来了新的突破。

研究人员在此次研究中运用了多种关键技术方法。首先,选用 GDSC v.6.0 等多个数据集,这些数据集涵盖了丰富的癌细胞系、药物以及多组学数据,为研究提供了充足的数据支持。其次,开发了一种新型的多组学预测方法 NxtDRP,该方法基于 NXTfusion 非线性数据融合库,能够灵活测试不同类型组学数据的相关性。同时,通过将药物的简化分子输入线输入系统(SMILES)表示转化为分子图,并利用图神经网络(Graph NN)进行处理,将药物结构信息融入模型。此外,还引入了实体关系(ER)图来整合细胞系、药物、蛋白质和基因等多方面信息,通过优化损失函数来训练模型。

下面来看看具体的研究结果:

  • 超越全局指标:稳健模型评估的聚合策略:研究人员提出了一种全新的评估框架,该框架包含三种聚合策略,即全局(Global)、固定药物(Fixed-Drug)和固定细胞系(Fixed-Cell Line)策略。与传统仅使用全局评估的方法不同,新框架从多个角度审视预测性能。全局策略计算整个测试集的性能指标;固定药物策略针对每个药物单独计算性能指标后取平均值,以此分析模型对不同细胞系药物反应的区分能力;固定细胞系策略则针对每个细胞系计算性能指标后取平均,用于评估模型在固定细胞系上对不同药物的区分能力。研究发现,不同聚合策略的性能表现与数据集特征以及训练测试集的划分策略紧密相关,仅依赖全局聚合策略可能会导致预测性能被高估。
  • 新型非线性多组学药物反应预测方法:研究人员开发的 NxtDRP 模型,通过在 GDSC 数据集上与 tCNN 和 GraphDRP 等方法进行对比测试,展示了不同组学数据整合对预测性能的影响。在随机拆分(Random Splits)验证中,虽然 NxtDRP 等模型在全局性能上表现良好,但多组学数据的加入并未显著提升性能,这表明在这种验证策略下,药物反应数据本身已能满足模型学习需求,额外的组学数据价值有限。在未见细胞系(Unseen cell lines)验证中,即便不含多组学信息的 NxtDRPMT模型也能在全局性能上达到较高水平,但这一结果具有误导性,因为其在固定药物性能评估中表现很差,说明模型实际上无法区分未见细胞系的药物反应。而加入多组学关系的 NxtDRPMT+EX+PR模型在固定药物设置下性能提升明显。在未见药物(Unseen drugs)验证中,预测 IC50值是一个极具挑战性的任务,当前缺乏可靠的计算方法。研究发现,现有 DRP 模型在该验证策略下表现不佳,且模型性能受 IC50值高变异性的影响较大。同时,研究还发现最大药物浓度(MC)与 IC50值高度相关,仅利用 MC 作为特征的 DummyMC 模型在全局预测聚合中甚至超越了其他 DRP 模型。

在讨论部分,研究人员强调了此次研究的重要意义。一方面,他们指出 IC50作为预测标签存在严重局限性,建议使用剂量反应曲线下面积(Area Under the Dose-Response Curve,AUDRC)替代 IC50。AUDRC 能够有效消除药物浓度范围对评估药物疗效的影响,更准确地反映药物与细胞的相互作用,在临床应用中也具有重要价值。另一方面,研究人员提出的新型验证协议,将 AUDRC 与固定药物、固定细胞系聚合策略相结合,能够更准确地评估 DRP 模型的泛化能力,避免模型因数据集偏差而产生误导性的高评分。这一验证协议为开发更可靠的 DRP 模型奠定了基础,有望推动精准肿瘤学领域的临床前药物研发,让癌症治疗更加精准、高效。

总的来说,这项研究通过深入剖析 DRP 模型在评估和预测标签方面存在的问题,提出了切实可行的解决方案,为精准肿瘤学中药物反应预测的发展指明了新方向,具有重要的理论和实践意义。

濞戞挸顑堝ù鍥┾偓鐟邦槹瀹撳孩瀵奸敂鐐毄閻庢稒鍔掗崝鐔煎Υ婵犲洠鍋撳宕囩畺缂備礁妫滈崕顏呯閿濆牓妯嬮柟娲诲幘閵囨岸寮幍顔界暠闁肩瓔鍨虫晶鍧楁閸撲礁浠柕鍡楊儐鐢壆妲愰姀鐙€娲ゅù锝嗘礋閳ь剚淇虹换鍐╃閿濆牓妯嬮柛鎺戞閻庤姤绌遍崘顓犵闁诡喓鍔庡▓鎴︽嚒椤栨粌鈷栭柛娆愬灩楠炲洭鎯嶉弮鍌楁晙

10x Genomics闁哄倹婢橀幖顪渋sium HD 鐎殿喒鍋撻柛姘煎灠瀹曠喓绱掗崱姘姃闁告帒妫滄ご鎼佹偝閸モ晜鐣遍柛蹇嬪姀濞村棜銇愰弴鐘电煁缂佸本妞藉Λ鍧楀礆閸℃ḿ鈧粙鏁嶉敓锟�

婵炲棎鍨肩换瀣▔鐎n厽绁癟wist闁靛棗锕g粭澶愬棘椤撶偛缍侀柛鏍ㄧ墱濞堟厤RISPR缂佹稒鐩埀顒€顦伴悧鍝ヤ沪閳ь剟濡寸€n剚鏆╅悗娑欏姃閸旓拷

闁告娲滅划蹇涙嚄閻愬銈撮幖鏉戠箰閸欏棝姊婚妸銉d海閻犱焦褰冮悥锟� - 婵烇絽宕崣鍡樼閸℃鎺撶鎼达綆鍎戝☉鎾亾濞戞搩浜滃畷鐔虹磼閸℃艾鍔掗悗鍦仱閻涙瑧鎷嬮幑鎰靛悁闁告帞澧楅弳鐔煎箲椤斿灝绐涢柟璨夊倻鐟㈤柛娆樺灥椤宕犻弽顑帡寮搁敓锟�

濞戞挸顑堝ù鍥Υ婵犲嫮鐭庨柤宕囧仜閸炴挳鎽傜€n剚顏ら悹鎰╁妺缁ㄧ増鎷呭⿰鍐ㄧ€婚柡瀣姈閺岀喎鈻旈弴鐘虫毄閻庢稒鍔掗崝鐔煎Υ閿燂拷

相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 急聘职位
    • 高薪职位

    知名企业招聘

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号