《npj Precision Oncology》:MRI transformer deep learning and radiomics for predicting IDH wild type TERT promoter mutant gliomas
编辑推荐:
为解决术前难以无创精准预测 IDHwt TERTp - mut胶质瘤的问题,研究人员开展基于多参数 MRI 序列构建融合模型的研究。结果显示,堆叠模型预测性能最佳,能有效识别该类胶质瘤并分层患者风险,有助于个性化预后评估。
胶质瘤是中枢神经系统最常见的原发性恶性肿瘤,如同隐藏在大脑深处的 “定时炸弹”,严重威胁着人们的生命健康。它具有高度的异质性,不同亚型的胶质瘤生物学行为差异巨大,患者的生存时间也大不相同。过去,医生主要依据组织学分级来评估胶质瘤患者的病情和预后,但这种方法逐渐暴露出局限性。随着研究的深入,人们发现 IDH 野生型(IDH
wt)胶质瘤增殖和侵袭性更强,患者预后较差;TERT 启动子突变(TERTp
-mut)也是胶质瘤的一个重要分子标记,与患者的临床预后密切相关。然而,目前检测 IDH 和 TERT 的常用方法是基于肿瘤组织样本的测序,这种方法需要进行有创操作,对患者身体状况要求较高,且检测成本昂贵,这就如同给患者和医疗资源都加上了沉重的 “枷锁”,限制了其在临床中的广泛应用。因此,寻找一种术前无创且精准的预测方法,成为了医学领域亟待解决的难题。
在这样的背景下,山西医科大学第一医院、山西医科大学医学影像学院等多个机构的研究人员挺身而出,开展了一项具有重要意义的研究。他们旨在通过一种新型融合模型,利用多参数 MRI 序列来预测 IDHwt TERTp - mut胶质瘤,并将模型的分类指标与患者风险分层相结合,为个性化的诊断和预后评估提供有力支持。该研究成果发表在《npj Precision Oncology》上,为胶质瘤的诊疗带来了新的曙光。
研究人员为开展此项研究,运用了多种关键技术方法。他们回顾性收集了 1185 例胶质瘤患者术前的 T1 加权增强(T1CE)和 T2 加权液体衰减反转恢复(T2FLAIR)MRI 图像,这些患者分别来自山西医科大学的三家附属医院(作为训练集)、北京天坛医院(外部验证集 1)以及 TCGA 数据集(外部验证集 2)。接着,研究人员使用 Sanger 测序检测 IDH 和 TERTp-mut的突变状态。在影像处理方面,对 MRI 图像进行刚性配准和重采样,并由经验丰富的神经放射科医生手动勾勒感兴趣区域(ROI)。此外,研究人员基于 CrossFormer 神经网络开发了多通道 2.5D 深度学习模型(MultiChannel_2.5D_DL 模型)和 2D 深度学习模型(2D_DL 模型),同时构建了影像组学模型,最后通过集成学习将这三种模型整合为堆叠模型。
下面来详细看看研究结果:
- 患者特征分析:研究共纳入 1185 例胶质瘤患者,其中 220 例(18.6%)为 IDHwt TERTp - mut患者,965 例(81.4%)为非 IDHwt TERTp - mut患者。在不同数据集中,IDHwt TERTp - mut患者的比例有所差异。同时,IDHwt TERTp - mut组和非 IDHwt TERTp - mut组在基线 WHO 分级特征上存在显著差异,部分数据集两组间年龄也有显著差异,但性别无明显差异。
- 特征提取和选择:研究人员总共提取了 3122 个影像组学特征、512 个 2.5D 深度学习特征和 1024 个 2D 深度学习特征。经过 LASSO 特征选择后,分别确定了 19 个 2.5D 深度学习特征、4 个 2D 深度学习特征和 15 个影像组学特征。其中,2.5D 深度学习特征数量最多且权重较高,影像组学特征中 T1CE_intra_square_gldm_DependenceNonUniformity 和 T2FLAIR_intra_wavelet_HLL_firstorder_Skewness 贡献最为显著。
- 模型的开发和性能:研究使用了七种分类器对三个单独的特征集进行处理,最终 GradientBoosting 在每个特征集中表现最佳。基于这三个单独模型的输出分数,AdaBoost 表现出最好的预测性能。在三个单模态模型中,MultiChannel_2.5D_DL 模型在所有研究集中的 AUC 值最高。而集成了三种模态的堆叠模型在所有研究集中的 AUC 值均达到最高,具有最佳的预测性能。决策曲线分析(DCA)显示,堆叠模型提供了更大的净效益。
- 基于堆叠分类模型的预后风险分层评估:根据堆叠模型在训练集上的输出分数,研究人员将患者分为高风险和低风险组。Log-rank 检验表明,在训练集和外部验证集 2 中,患者的总生存期(OS)可根据堆叠模型的输出分数进行显著分层。Cox 回归分析结果显示,该分数是独立的预后因素,能够有效区分不同风险组的患者。
研究结论和讨论部分指出,MultiChannel_2.5D_DL 模型相比 2D_DL 模型和影像组学模型,能更好地从大数据中提取空间特征,具有更优的预测性能。而基于集成学习策略构建的堆叠模型,综合了三种单模态模型的优势,在预测 IDHwt TERTp - mut胶质瘤方面表现最为出色。该研究首次将 CrossFormer 深度学习模型应用于胶质瘤分子亚型研究,为胶质瘤的分子分型提供了新的方法和思路。同时,研究还发现 2.5D 数据在捕捉肿瘤特征方面具有独特优势,能够更全面地反映肿瘤的动态变化和复杂空间特征。此外,数据融合策略在提高模型性能方面也发挥了重要作用,堆叠模型更全面地整合了相关图像信息,使得预测更加准确。
不过,该研究也存在一些局限性,例如属于回顾性分析,患者的预后信息不够完整,训练数据中不同基因组合的病例比例较小,可能导致过拟合或泛化能力差等问题。此外,2D 深度学习模型在捕捉图像全局信息方面存在不足,3D 深度学习模型对数据量和数据质量要求较高,研究仅使用了常规 MRI 序列构建模型等。但研究人员计划在后续研究中继续收集多中心数据,进一步完善模型,提高其稳健性和泛化能力。
总的来说,这项研究成果为胶质瘤的术前精准诊断和治疗决策提供了重要的技术支持,有望改善患者的生存结局。通过将模型集成到临床工作流程中,并结合 DCA、敏感性和特异性等指标,能够更有效地支持临床决策,为胶质瘤患者带来更多的希望,也为未来胶质瘤的研究和治疗开辟了新的方向。
下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究
10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!
欢迎下载Twist《不断变化的CRISPR筛选格局》电子书
单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析
下载《细胞内蛋白质互作分析方法电子书》