基于 T2WI 的深度学习模型:精准预测肌肉浸润性膀胱癌的新利器

《Scientific Reports》:Deep learning on T2WI to predict the muscle-invasive bladder cancer: a multi-center clinical study

【字体: 时间:2025年03月23日 来源:Scientific Reports 3.8

编辑推荐:

  为预测肌肉浸润性膀胱癌(MIBC),研究人员构建基于 MRI 的深度学习(DL)模型,该模型有较高预测准确性,意义重大。

  

一、研究背景:膀胱癌诊断的困境与挑战

膀胱癌(Bladder cancer,BCa)在全球癌症舞台上占据着重要位置,是第 10 大常见癌症。2020 年,约 57.3 万新发病例和 21.3 万死亡病例,这些数字背后是无数家庭的痛苦与挑战。治疗方案的选择高度依赖于癌症诊断时的分期,然而,约 25% 的患者初诊时就已是肌肉浸润性膀胱癌(Muscle-invasive bladder cancer,MIBC),其余为非肌肉浸润性膀胱癌(Non-muscle-invasive bladder cancer,NMIBC)。根治性膀胱切除术(Radical cystectomy,RC)是 MIBC 及部分高危 NMIBC 的标准治疗手段,但令人头疼的是,9 - 49% 的 BCa 病例分期存在错误,这意味着许多患者接受了不恰当的治疗,严重影响预后。
目前,膀胱镜检查、计算机断层扫描和磁共振成像(Magnetic resonance imaging,MRI)在膀胱癌术前诊断中发挥着重要作用。MRI 凭借其高空间和对比分辨率,能清晰展现解剖结构,在判断肌肉浸润状态方面潜力巨大。2018 年提出的膀胱成像报告和数据系统(Vesical imaging-reporting and data system,VI-RADS),基于 mpMRI 上肿瘤的大小、位置、数量和形态来预测肌肉浸润风险,但它也存在局限性,部分被归类为 VI-RADS 3 的患者无法明确肌肉浸润状态。
人工智能(Artificial intelligence,AI)在医学领域的应用日益广泛,深度学习(Deep learning,DL)作为其中的佼佼者,已在多种疾病诊断中展现优势,如肝脏纤维化、胰腺癌等。在泌尿系统疾病中,利用 DL 预测 MIBC 术前状态备受关注,但此前基于 MRI 的 DL 模型研究缺乏大样本和多中心验证。因此,开展一项基于 MRI 的 DL 模型多中心研究,精准预测 MIBC 迫在眉睫。

二、研究概况:多中心研究带来新突破

南京医科大学第一附属医院等多家机构的研究人员勇挑重担,开展了这项意义非凡的研究。该研究经伦理委员会批准并在 ClinicalTrials.gov 注册,从 2012 年 2 月至 2023 年 12 月,收集了 559 例患者,其中 521 例来自本中心,38 例来自外部中心。这些患者均接受了术前 MRI 和手术,且都签署了知情同意书。
研究人员运用了多种关键技术方法。首先,通过自动分割技术,由本中心开发的级联路径增强 Unet(Cascade Path Augmentation Unet,CPA-Unet)对 MRI 图像进行自动分割,之后放射科医生会重新检查。接着,基于分割后的 T2 加权图像(T2 weighted images,T2WI),以 Inception V3 为主要模型构建 DL 模型,该模型包含重建块和分类块,能端到端地对 MIBC 和 NMIBC 进行分类。在分析数据时,使用 IBM SPSS statistics(v26.0)进行统计分析,评估指标包括敏感性(Sensitivity,SN)、特异性(Specificity,SP)、准确性(Accuracy)和受试者工作特征曲线下面积(Area under the curve of ROC,AUC)等。

三、研究结果:模型性能表现出色

  1. 患者特征:559 例患者在年龄、性别、肌肉浸润状态等临床特征上,组间无统计学差异。根据 DL 模型在验证集的敏感性和特异性,经 PASS 软件计算,样本量至少为 135 例。最终,内部测试集纳入 164 例患者,外部测试集纳入 38 例患者。
  2. 阅片者一致性:两名阅片者在幻灯片评估和 VI-RADS 评分上一致性良好。幻灯片评估的 kappa(k)值为 0.869,P<0.001;在验证测试集、内部测试集和外部测试集中,VI-RADS 评分的 k 值分别为 0.927、0.922 和 0.831,P 均 < 0.001。
  3. DL 模型和 VI-RADS 的性能:在验证集、内部测试集和外部测试集中,DL 模型预测 MIBC 的准确性分别为 92.4%、92.1% 和 81.6%,敏感性分别为 94.7%、86.8% 和 57.1%,特异性分别为 91.5%、94.6% 和 87.1%,阳性预测值(Positive predictive value,PPV)分别为 81.8%、88.5% 和 50.0%,阴性预测值(Negative predictive value,NPV)分别为 97.7%、93.8% 和 90.0%。与 VI-RADS 相比,在验证集和内部测试集中,DL 模型与 VI-RADS 的 AUC 无统计学差异;联合模型在验证集和内部测试集的性能优于单一模型,但在外部测试集未显示出优势。
  4. 不同 VI-RADS 下 DL 模型的性能:在 VI-RADS 1 中,DL 模型准确性为 100%;在 VI-RADS 2、4、5 中,准确性均超 90%,分别为 93.5%、90.3% 和 93.9%;在 VI-RADS 3 中,准确性为 80%,为该类患者的诊断提供了新的补充工具。
  5. 不同膀胱解剖位置的模型性能:DL 模型在不同膀胱解剖位置预测 MIBC 的准确性、敏感性和特异性有所差异。例如,在膀胱颈和三角区,准确性为 63.2%,敏感性为 71.4%,特异性为 58.3%;在左右壁,准确性为 92.0%,敏感性为 85.4%,特异性为 94.5% 等。
  6. 典型病例分析:通过典型病例展示了 DL 模型判断肌肉浸润状态的过程,输入患者含肿瘤的 MRI 幻灯片,模型预测概率值,结果与最终病理结果一致。同时,分析了误分类病例,发现常见特征为肿瘤位于输尿管口附近或膀胱顶部、颈部。

四、研究结论与讨论:开启膀胱癌诊断新篇章

研究构建了基于 T2WI 和 Inception V3 的 DL 模型用于预测 MIBC,结果表明该模型在预测 MIBC 方面具有一定优势,尤其在 VI-RADS 3 的情况下,能为临床诊断提供额外价值。
不过,研究也存在一些局限性。DL 模型的 “黑箱” 性质导致其决策过程难以解释,未来可通过可视化技术探索其原理。外部中心患者数量有限,临床病理特征分布与本中心存在差异,且 MRI 成像质量不同,影响了模型在外部测试集的性能。后续研究可通过数据增强技术和多中心训练策略,增加训练数据集的多样性,建立专门的数据预处理流程来解决多中心数据差异问题。
总体而言,这项多中心临床研究成果为膀胱癌的精准诊断带来了新希望。DL 模型有望成为临床医生的得力助手,提高 MIBC 的诊断准确性,让更多患者得到及时、恰当的治疗,推动膀胱癌诊疗领域向前迈进一大步。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号