编辑推荐:
为解决低核级导管原位癌(LNG DCIS)术前预测难题,研究人员构建集成模型,显著提升预测能力,意义重大。
在乳腺癌的诊疗领域,导管原位癌(Ductal Carcinoma In Situ,DCIS)的出现逐渐引起人们的关注。如今,随着乳腺癌筛查的广泛开展,DCIS 的检出率不断攀升,它占所有新诊断乳腺癌病例的四分之一以上。然而,当前 DCIS 的治疗面临着诸多挑战。一方面,DCIS 具有高度的异质性,不同患者的病情发展和预后差异很大;另一方面,现有的诊断方法依赖于侵入性活检,但活检在全面表征肿瘤方面存在局限性,难以准确判断哪些 DCIS 患者更易发展为浸润性癌。此外,DCIS 的过度诊断问题也备受关注,因为大多数 DCIS 病变不会发展为浸润性疾病,却可能导致患者接受不必要的治疗。
其中,低核级导管原位癌(Low nuclear grade ductal carcinoma in situ,LNG DCIS)和高核级导管原位癌(High nuclear grade ductal carcinoma in situ,HNG DCIS)在生物学行为上有显著差异。HNG DCIS 与高级别浸润性癌相关,具有更强的生物学侵袭性;而 LNG DCIS 的病情相对温和。此前研究发现,对于 LNG DCIS 患者,手术切除的临床优势并不明显,一些前瞻性随机试验也聚焦于对低至中级核级 DCIS 患者进行非手术监测。因此,术前准确识别 LNG DCIS 对于优化患者治疗策略、减少不必要的侵入性检查和治疗至关重要。
为了攻克这一难题,来自华东师范大学附属芜湖医院(芜湖市第二人民医院)、南京医科大学附属南京第一医院、安徽医科大学第一附属医院等机构的研究人员展开了深入研究。他们的研究成果发表在《Scientific Reports》上,为 DCIS 的诊疗带来了新的希望。
在这项研究中,研究人员采用了多种关键技术方法。首先,他们收集了 2014 年 1 月至 2023 年 7 月期间在医院经手术病理确诊的 DCIS 患者的数据,包括临床数据、术前超声(Ultrasound,US)和乳腺 X 线摄影(Mammography,MG)影像数据等,构建了样本队列。然后,通过图像分割和影像组学特征提取,从 US 和 MG 图像的感兴趣区域提取了大量定量特征,并利用组内相关系数(ICC)评估特征的可重复性,保留 ICC>0.8 的特征。接着,运用 LASSO 回归进行特征选择,构建了 US、MG 以及 US+MG 影像组学模型。最后,他们整合临床、影像和影像组学特征,运用 Elastic Net、广义线性模型增强(Generalized Linear Models with Boosting,glmboost)和 Ranger 算法构建了集成机器学习框架来预测 LNG DCIS。
下面来看具体的研究结果:
- 患者基线特征:研究共纳入 237 例患者的 241 例 DCIS 病例,随机分为训练队列(n=168)和验证队列(n=73)。分析发现,LNG DCIS 组和中高核级 DCIS 组在 US 和 MG 形态、US-BI-RADS、MG-BI-RADS、雌激素受体(ER)、孕激素受体(PR)、人表皮生长因子受体 2(HER2)和 Ki-67 水平等方面存在显著差异(p<0.05),但年龄、症状和结节大小在各组间无显著差异12。
- 特征选择:从 US 和 MG 图像中总共提取了 210 个影像组学特征,经 ICC 评估和 LASSO 回归,最终确定了 4 个具有非零系数的预测特征,构建了 US+MG 影像组学模型。该模型在训练队列和验证队列中表现出最佳诊断性能,AUC 分别为 0.83 [0.81 - 0.86] 和 0.81 [0.77 - 0.84]3。
- 模型性能比较:训练了临床模型和影像组学集成模型并进行比较。结果显示,在训练队列和验证队列中,影像组学集成模型的诊断性能均优于临床模型。在验证队列中,临床模型的 AUC 为 0.86(95% CI 0.76 - 0.97),而影像组学集成模型的 AUC 达到 0.92(95% CI 0.84 - 0.96)45。
- 影像组学集成模型的预测价值提升:通过综合判别改善(Integrated Discrimination Improvement,IDI)和净重分类改善(Net Reclassification Improvement,NRI)评估发现,影像组学特征的加入显著提升了模型的预测能力(p<0.001)。决策曲线分析(Decision Curve Analysis,DCA)也表明,影像组学集成模型在广泛的阈值概率范围内提供了更高的净效益6。
- 对疾病无进展生存期(DFS)的预测潜力:以 0.55 为阈值,影像组学集成模型将患者分为高风险和低风险组。Kaplan - Meier 分析显示,该模型能有效根据 DFS 风险对患者进行分层(log-rank 检验,p<0.0031),这对于指导个性化治疗策略具有重要意义7。
- 模型解释和特征重要性:利用 Shapley 加性解释(SHAP)值对模型进行解释和特征重要性评估。结果表明,影像组学、临床和影像特征的整合提升了模型性能,并且 SHAP 瀑布图为模型的决策过程提供了可解释性8。
在研究结论和讨论部分,研究人员成功构建了基于 US 和 MG 多模态特征的影像组学集成模型,用于术前预测 LNG DCIS。该模型在内部验证队列中展现出卓越的预测准确性,能有效根据 DFS 风险对 DCIS 患者进行分类。与以往研究相比,该研究具有诸多优势。例如,它结合了双模态影像组学特征和集成机器学习算法,相比单模态分析具有更好的预测性能;通过 LASSO 回归分析,凸显了两种成像方式在预测 LNG DCIS 中的互补作用;此外,研究还纳入了具有明确公式和生物学意义的影像组学特征,提升了模型的可解释性。
然而,研究也存在一定的局限性。样本量相对较小,可能影响模型的稳健性和泛化能力;部分潜在混杂因素未被考虑,如术前活检信息;模型是基于单中心回顾性数据训练和验证的,可能存在中心特异性效应和选择偏倚。未来需要更大规模、多中心的前瞻性数据集来进一步验证模型的有效性,并探索自动分割技术以提高效率。
总体而言,这项研究为 DCIS 的术前预测提供了新的方法和思路,有助于优化临床决策,改善患者预后,具有重要的临床应用价值和研究意义。