基于深度学习的H&E染色病理图像人工智能系统TRIP实现三阴性乳腺癌精准识别与预后预测

《Eco-Environment & Health》:Investigating the potential association between tattoos and lymphoma: an exploratory systematic review and meta-analysis

【字体: 时间:2025年10月16日 来源:Eco-Environment & Health 17.6

编辑推荐:

  本研究针对三阴性乳腺癌(TNBC)诊断依赖耗时昂贵的免疫组化(IHC)且预后预测受限的问题,开发了基于H&E染色全切片图像(WSI)的人工智能系统TRIP。该系统在内部验证中TNBC识别AUC达0.980,外部验证AUC为0.853–0.927;预后预测C-index达0.720–0.747,显著优于现有模型。TRIP系统具有高度可解释性,能发现关键组织学特征并与多组学结果一致,为TNBC的精准诊疗提供了高效、可推广的AI解决方案。

  
三阴性乳腺癌(Triple-Negative Breast Cancer, TNBC)作为乳腺癌中最具侵袭性的亚型,约占乳腺癌患者的15%,其特征是缺乏雌激素受体(ER)、孕激素受体(PR)和人表皮生长因子受体2(HER2)的表达。这意味着它无法从针对这些分子的靶向治疗中获益,其治疗选择有限,主要依赖化疗。TNBC具有复发率高、生长迅速、治疗后转移可能性大等特点,其5年生存率约为75%,显著低于其他乳腺癌亚型(>90%)。目前的临床诊断金标准是免疫组化(IHC)检测ER、PR蛋白表达水平,以及IHC和/或荧光原位杂交(FISH)检测HER2。然而,这些基于分子标志物的检测方法成本高、耗时长,且需要足够的合格组织样本,其应用受到限制。此外,TNBC具有高度异质性,即使处于相同TNM分期的患者也可能经历截然不同的临床结局。因此,临床实践迫切需要一种能够超越受体分型、实用、经济且能利用现成样本进行TNBC识别的替代方法,以及一个能够有效预测其预后的模型。
尽管肿瘤浸润淋巴细胞(TIL)和肿瘤相关基质(TAS)等一些预后生物标志物已被证实与TNBC患者的生存相关,但鉴于肿瘤微环境中众多因素共同促进TNBC进展,仅依赖少数几个生物标志物可能无法实现精准的预后预测。近年来,随着计算能力的大幅提升,深度学习已成为计算病理学领域的有效工具,尤其是在处理千兆像素级别的全切片图像(Whole Slide Image, WSI)方面。在肺癌、卵巢癌、肝癌和结直肠癌等多种恶性肿瘤中,人工智能(AI)的应用已在诊断(如肿瘤检测、分型、分级)和预后(如生物标志物发现、治疗反应预测、生存分析)方面取得显著进展。然而,针对TNBC的计算病理学研究相对较少。现有研究通常受限于队列规模小、过度依赖预定义的生物标志物(如基质肿瘤浸润淋巴细胞)、碎片化的多阶段流程以及缺乏外部验证,这些都阻碍了其向临床转化。
此前的研究主要集中于预测分子亚型或进行半定量生物标志物评估。例如,有研究提出了结合斑块级卷积神经网络和幻灯片级逻辑回归的两阶段流程,在预测ER、PR和HER2方面取得了中等水平的曲线下面积(AUC)。另有研究应用弱监督框架(CLAM)对乳腺癌亚型进行分类,但对TNBC的敏感性有限。在预后领域,一些研究探索了肿瘤浸润淋巴细胞(TIL)特征或肿瘤-基质比率,但它们对劳动密集型注释或手工制作特征的依赖,常常导致预测性能一般且跨队列泛化能力较差。
这些局限性突出表明,我们需要一个强大、全自动且可推广的系统,能够从标准的H&E染色WSI中联合识别TNBC并预测患者预后。为了填补这一空白,研究人员开发并全面验证了一个统一的端到端深度学习系统——TNBC识别与预后预测(TRIP)系统。
本研究发表在《Eco-Environment 》上,研究人员开展了一项多中心回顾性研究,旨在开发和验证TRIP系统。该系统利用来自中国五家顶级医院和公共数据库的大规模乳腺癌队列数据,整合了病理基础模型和有效的长序列建模技术,以提取具有临床意义的组织学模式。研究队列包括来自浙江大学医学院附属第一医院(FAH)的2045名乳腺癌患者,其中451名TNBC患者有完整的无病生存期(DFS)和总生存期(OS)随访数据。此外,外部验证队列来自中国东部和中部的四家三级医院:山东省立医院(SDPH)、浙江大学医学院附属邵逸夫医院(SRRS)、义乌市中心医院(YWCH)、武汉市中心医院(WHCH)以及癌症基因组图谱(TCGA)数据集,共计2793例用于TNBC识别,463例用于预后预测。研究人员遵循TRIPOD-AI清单以确保最佳实践报告。
为开展研究,作者主要应用了以下几项关键技术方法:1. 深度学习方法:构建了TRIP系统,该系统包含两个主要模块,一个用于从乳腺癌人群中鉴别TNBC(TNBC分类模型),另一个用于预后预测(包含DFS分析模型和OS分析模型)。系统采用统一的多示例学习(MIL)框架,整合了最先进的病理基础模型(GPFM)进行斑块级特征提取。2. 双向Mamba编码器:采用基于状态空间模型的新型架构进行全切片图像分析,以建模斑块序列中的长程依赖关系,克服了传统MIL方法将WSI视为无序斑块集合的局限。3. 测试时适应(TTA)策略:为了提高模型在不同验证队列(如染色、扫描和站点特异性偏差 variations)间的泛化能力,采用TTA在保持所有其他参数冻结的情况下微调归一化层的参数,从而增强鲁棒性。4. 可解释性分析:通过生成显著性图(热图)来可视化模型决策所依据的WSI关键区域,并由资深病理学家进行验证,以发现与TNBC识别和预后相关的关键模式。5. 整合多组学分析:对来自FAH队列的211例患者进行了全基因组RNA测序,采用差异基因表达(DGE)分析和基因集变异分析(GSVA)来探索TNBC的分子异质性,并将AI的预后预测与分子证据进行关联验证。
研究结果
TNBC识别性能卓越
TRIP系统在TNBC识别任务中表现出色。在内部验证队列(FAH)中,该系统结合测试时适应(TTA)后,识别TNBC的AUC达到了0.980(95% CI: 0.958–0.996),灵敏度为0.963,特异性为0.857。在外部验证队列中,系统同样展现了良好的泛化能力:在SDPH、SRRS、WHCH和TCGA队列中的AUC分别为0.916、0.936、0.860和0.890。与现有的两种最先进的AI模型(MaxMIL和AttMIL)相比,TRIP系统显示出显著优势,在内部验证队列中绝对AUC提升了5.2%和3.5%,在外部验证队列中平均绝对AUC提升幅度更大。
预后预测准确可靠
在预后预测方面,TRIP系统同样取得了令人瞩目的成果。在FAH队列中,TRIP+TTA模型预测无病生存(DFS)和总生存(OS)的C-index分别达到0.747 ± 0.070和0.744 ± 0.075。在外部验证组合队列EXSURV(由SDPH、SRRS和YWCH合并)中,DFS和OS的C-index分别为0.731 ± 0.047和0.720 ± 0.034;在TCGA队列中,则分别为0.732 ± 0.043和0.721 ± 0.030。相比之下,MaxMIL和AttMIL模型的表现则逊色很多,尤其是在外部数据集上出现了显著的性能下降。Kaplan-Meier生存分析进一步证实,TRIP系统能够有效地将患者划分为高风险和低风险组,且组间生存差异在所有数据集中均具有统计学显著性(log-rank P值 <0.0033)。
模型揭示关键组织学特征
通过注意力热图的可视化分析,TRIP系统揭示了与TNBC识别和预后相关的关键组织学特征。对于TNBC识别,研究发现TNBC肿瘤细胞表现出明显的核异型性,细胞核多形性、不规则,含有囊状染色质和明显的核仁。此外,常见有丝分裂象,肿瘤细胞主要排列成实性巢或片状,缺乏腺管状结构。间质表现出明显的纤维化增生和胶原瘢痕形成,中央肿瘤坏死也常见。在预后预测方面,与预后良好组相比,预后不良的TNBC病例通常表现出更显著的促结缔组织增生间质,更具侵袭性的浸润性生长模式(肿瘤边缘交错),以及间质中淋巴细胞和浆细胞浸润较少。此外,肿瘤坏死在预后不良组中也明显更常见。
多组学分析验证生物学基础
整合的多组学分析为TRIP系统的预后预测提供了分子生物学层面的支持。通过差异基因表达分析,在TRIP系统划分的高危和低危TNBC样本之间,鉴定出84个上调基因和32个下调基因。基因集变异分析(GSVA)揭示了三个具有独特转录和通路激活特征的分子簇(C1-C3)。其中,C2簇在诸如HALLMARK_ALLOGRAFT_REJECTIONHALLMARK_INTERFERON_GAMMA_RESPONSEHALLMARK_INTERFERON_ALPHA_RESPONSE等通路上表现出高活性,这些通路在增强免疫系统功能中起关键作用,与TNBC的免疫调节亚型一致,并对应于更好的预后。C3簇则表现出TNBC间充质亚型相关的上皮-间质转化(EMT)特征,与不良预后相关。而C1簇中的HALLMARK_ANDROGEN_RESPONSE通路可能与管腔雄激素受体(LAR)亚型有关。Kaplan-Meier分析证实,C2簇的预后显著优于C1和C3簇(P值<0.05)。这些发现确认了TRIP系统的预后预测与已有的分子研究发现相符。
研究结论与意义
本研究成功开发并验证了TRIP,一个用于TNBC自动化识别和预后预测的端到端深度学习系统。该系统利用常规H&E染色WSI,在涵盖4000多例乳腺癌病例(包括1000多例TNBC患者)的多中心数据集上证明了其高诊断准确性和一致的预后分层能力。TRIP系统的创新之处在于它采用了通用的病理基础模型(GPFM)来提取对染色变化鲁棒的斑块嵌入,集成了双向Mamba-based编码器来建模长程空间依赖关系,并利用测试时适应(TTA)来动态调整跨队列的分布偏移,从而增强了鲁棒性和泛化能力。
从临床角度来看,TRIP系统可以作为一种分诊工具,优先安排需要进行确认性IHC/FISH检测的病例;作为决策支持辅助工具,验证模糊的受体状态;或者在资源有限的环境下作为独立的诊断系统。其可解释性通过注意力热图得到增强,这些热图突出显示了与已知TNBC表型一致的组织病理学区域,增加了系统的可信度和临床透明度。此外,TRIP系统的预后预测得到了多组学分析的支持,揭示了与不同风险分层相关的独特免疫和促肿瘤信号特征。
该研究的局限性包括目前分析仅限于术后切除标本,未涵盖更常用于早期诊断的空芯针穿刺活检(CNB)样本;未将年龄、TNM分期等临床变量纳入模型;以及需要前瞻性验证来评估其真正的临床影响,特别是在指导降级治疗策略方面。
总之,TRIP系统以其可扩展性、可解释性和强大的性能,有潜力帮助病理学家识别侵袭性TNBC病例并制定风险适应性的治疗策略,为改善TNBC的临床管理提供了有希望的人工智能工具。未来的工作方向包括扩展其应用于活检场景、整合临床和基因组数据形成多模态框架,以及启动前瞻性研究以评估其真实世界的临床效用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号