DeepOmicsSurv 模型:精准预测口腔癌患者生存时间的新利器

【字体: 时间:2025年04月26日 来源:Discover Oncology 2.8

编辑推荐:

  口腔癌严重威胁全球健康,精准预测其患者生存时间意义重大。研究人员开展 “DeepOmicsSurv: a deep learning?based model for survival prediction of oral cancer” 研究,构建 DeepOmicsSurv 模型。结果显示该模型预测准确性高,能揭示影响生存时间的临床因素,为口腔癌诊疗提供新工具。

  在全球范围内,口腔癌如同一个隐匿的 “健康杀手”,悄然威胁着人们的生命。每年,它都导致大量新发病例和死亡,印度更是深受其害,有着极高的死亡率。而且,这种疾病的发病率和死亡率在全球许多国家都呈上升趋势。
早期发现口腔癌,患者的五年生存率能达到 82% ,可一旦病情发展到晚期,生存率会急剧降至 27% 。目前,虽然有不少研究尝试利用临床数据来预测口腔癌患者的生存时间,但效果参差不齐。像 Hung 等人使用的 Extreme Gradient Boosting(XGBoost)模型,均方误差(MSE)高达 486.55;Adeoye 和 Kim 等人运用 DeepSurv 模型,C 指数分别为 0.89 和 0.81。这些传统模型仅仅依赖临床数据,难以捕捉那些复杂的、可能影响患者生存时间的基因突变信息。

随着多组学技术的不断进步,为我们深入了解癌症预后的遗传变异提供了新视角。然而,多组学数据的高维度和异质性又带来了新的挑战。为了突破这些困境,来自印度潘贾布大学(University Institute of Engineering and Technology, Panjab University)和旁遮普工程学院(Punjab Engineering College)等机构的研究人员,开展了一项极具意义的研究。他们构建了一个名为 DeepOmicsSurv 的深度学习模型,旨在更精准地预测口腔癌患者的生存时间。这项研究成果发表在了《Discover Oncology》上,为口腔癌的研究和治疗带来了新的曙光。

研究人员为开展此项研究,用到了多个关键技术方法。数据方面,从癌症基因组图谱(TCGA)的 TCGA-HNSC 项目获取了 528 名患者的临床、DNA 甲基化、拷贝数变异(Copy Number Alteration,CNA)和 mRNA 表达数据。针对数据的高维度问题,采用了主成分分析(PCA)、非负矩阵分解(NMF)、自动编码器等多种降维技术。同时,利用 SHapley Additive Explanations(SHAP)分析临床特征对生存预测的影响。在模型构建上,以 DeepSurv 模型为基础,添加卷积层、池化层、多头注意力层和 Dropout 层等,构建了 DeepOmicsSurv 模型。

下面来看具体的研究结果:

  • 不同降维技术的效果比较:研究人员对 PCA、自动编码器、核 PCA(Kernel-PCA)等多种降维技术进行了分析。结果显示,自动编码器在处理多组学数据时表现最佳,DeepOmicsSurv 结合自动编码器获得了最高的 C 指数(0.966),最低的平均绝对误差(MAE,0.0795)和中位数绝对误差(MedAE,0.0515),表明其处理复杂高维数据的能力很强。
  • 与其他模型的性能对比:将 DeepOmicsSurv 与 DeepSurv、卷积神经网络(CNN)、循环神经网络(RNN)、DeepHit 和 Cox 比例风险模型(CoxPH)进行比较。使用临床数据时,DeepOmicsSurv 的 C 指数为 0.8912,MSE 为 0.0316 ,均优于其他模型;使用多组学数据时,DeepOmicsSurv 优势更明显,C 指数高达 0.966,MSE 为 0.0138 ,在所有评估指标上均超越其他模型,展现出卓越的预测准确性。
  • 不同数据类型对模型性能的影响:研究发现,DeepOmicsSurv 使用多组学数据时性能最佳,C 指数为 0.966。DNA 甲基化 + 临床、CNA + 临床等组合数据的模型性能次之,单纯临床数据的模型性能相对较低,但仍有较强的预测能力。这表明多组学数据与临床数据结合,能更好地揭示基因组数据与临床数据之间的复杂相互作用,提升预测效果。
  • 模型的可解释性分析:通过 SHAP 分析,研究人员发现诊断年龄(Diagnosis Age)是影响患者生存结果的最重要特征,其次是肿瘤淋巴结分期(AJCC_N_Stage)。吸烟史、饮酒史等生活方式因素,以及癌症分期相关特征,如 AJCC 肿瘤分期(AJCC Tumor Stage)和 AJCC T 分期(AJCC T Stage),也对模型预测有重要贡献。

综合研究结果,研究人员得出结论:DeepOmicsSurv 模型在预测口腔癌患者生存时间方面表现出色,无论是使用临床数据还是多组学数据,都能实现高精度预测。该模型不仅能捕捉高维数据中的复杂关系,还通过 SHAP 分析揭示了影响生存时间的关键临床特征。这一成果意义非凡,它为口腔癌的精准医疗提供了强有力的工具,有助于医生更准确地评估患者的预后,制定更合理的治疗方案。不过,该研究也存在一定局限性,比如仅使用了 TCGA-HNSC 数据,缺乏外部验证,数据类型也相对有限。未来,研究人员计划在真实世界数据中进一步验证模型,并纳入更多类型的数据,如 miRNA 和蛋白质数据,同时寻找关键分子标记,让模型更适用于临床应用。相信随着研究的不断深入,DeepOmicsSurv 模型将在口腔癌的诊疗中发挥更大的作用,为患者带来更多的生存希望。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号