基于定制Transformer的多中心研究:从肺腺癌组织学全切片图像预测淋巴结转移

《npj Precision Oncology》:Customized transformer for lymph node metastasis prediction from lung adenocarcinoma histology in a multicentric study

【字体: 时间:2025年12月04日 来源:npj Precision Oncology 8

编辑推荐:

  为解决肺腺癌(LUAD)淋巴结转移(LNM)术前评估难题,研究人员开展了一项多中心研究,提出定制Transformer多示例学习框架CTMIL。该模型直接利用原发肿瘤H&E染色全切片图像(WSI)进行LNM预测,在内部验证和外部测试中AUROC最高达0.8640,显著优于TransMIL和AMIL等基线方法。研究表明组织学图像蕴含淋巴结转移预测信号,为pNx患者精准分期提供新思路。

  
肺腺癌作为非小细胞肺癌中最常见的亚型,其淋巴结转移状态是影响患者预后的关键因素。据统计,局部肺腺癌患者的五年生存率可达87%,而一旦发生区域淋巴结转移,生存率将骤降至36%。然而临床实践中,约有6-11%的术后患者因采样限制无法确定淋巴结状态(pNx),这为精准分期和治疗决策带来巨大挑战。
目前淋巴结转移预测主要依赖影像学(如PET/CT)和分子标志物检测,但这些方法难以捕捉肿瘤组织学中蕴含的形态学特征。病理学研究已发现微乳头状、实体型等侵袭性生长模式与淋巴结转移风险密切相关,但如何系统性提取这些形态学特征并构建预测模型仍是未解难题。常规计算方法多采用卷积神经网络(CNN)基础上的多示例学习(MIL),但在处理全切片图像(WSI)时难以有效建模斑块间的长程依赖关系。
针对这一瓶颈,武汉大学人民医院等机构的研究团队在《npj Precision Oncology》发表了题为"Customized transformer for lymph node metastasis prediction from lung adenocarcinoma histology in a multicentric study"的研究论文。该研究创新性地提出CTMIL(定制Transformer多示例学习)框架,通过融合空间编码、更深层Transformer架构和斑块级辅助监督机制,实现了从原发肺腺癌组织学图像直接预测淋巴结转移的突破。
研究团队采用多中心回顾性设计,纳入TCGA队列(400例)作为训练验证集,武汉大学人民医院(RM队列,164例)和中南大学湘雅三医院(XY队列,149例)作为外部测试集。技术路线包含三个关键环节:首先基于InceptionResNetV2开发肿瘤斑块检测模型(准确率0.9892);然后分别使用ResNet50、InceptionResNetV2和UNI三种骨干网络提取斑块特征;最后构建CTMIL框架进行淋巴结转移预测。该框架将Transformer编码器从2层增至6层,引入位置编码,并采用双目标损失函数联合优化幻灯片级和斑块级预测。
研究结果显示,基于UNI特征的CTMIL模型(UNI_CTMIL)表现最优,在验证集、XY队列和RM队列的AUROC分别达到0.8640、0.8216和0.8090,显著优于注意力机制MIL(AMIL)和原始TransMIL框架。消融实验证实,更深层Transformer结构和辅助监督机制分别贡献了约15%和10%的性能提升。值得注意的是,集成三个CTMIL模型的Ensemble_CTMIL在外部测试中AUROC进一步提升至0.8407,展现出良好的泛化能力。
选择最优CNN模型进行肿瘤斑块检测
通过系统比较五种预训练CNN架构,研究发现InceptionResNetV2在测试集上获得最高准确率(0.9892)和AUC(0.9997),被选为下游分析的斑块分类器。
CTMIL与基线MIL模型的比较评估
在所有测试场景中,CTMIL系列模型均稳定优于AMIL和传统基线方法。特别是在RM队列中,UNI_CTMIL的AUROC(0.8090)较UNI_AMIL(0.6697)提升超过13个百分点,证明Transformer架构在捕获复杂形态模式方面的优势。
CTMIL架构组件的消融分析
逐步去除集成策略、辅助监督和深层Transformer组件后,模型性能呈现阶梯式下降,验证了各创新点的有效性。在RM队列中,无辅助监督的变体虽取得最高AUROC(0.8338),但UNI_CTMIL仍显著优于原始TransMIL(0.7353)。
斑块级可解释性与形态学评估
通过可视化注意力热图和斑块分类得分,研究发现模型重点关注区域与已知转移特征高度吻合。对300个斑块的定量分析显示,LNM阳性组更频繁出现高肿瘤细胞密度(>60%)、低分化形态、微乳头状/实体型生长模式以及黏液成分(P<0.001)。桑基图进一步揭示,LNM阳性病例特征路径主要表现为实体型/腺泡型/微乳头状模式、低分化、黏液阳性和高肿瘤细胞占比的组合。
讨论部分指出,这是首个针对肺腺癌的多中心WSI淋巴结转移预测研究,突破性地将Transformer架构应用于该任务。与传统方法相比,CTMIL能更有效捕捉肿瘤异质性和长程空间依赖,其注意力机制可定位到与转移潜能相关的形态学特征,如微乳头状结构、实体型区域等。这对于临床中淋巴结评估不完整的病例尤其有价值,可能为pNx患者提供额外的风险分层依据。
研究同时承认存在若干局限性:首先,由于各队列均完成淋巴结清扫,模型在pNx人群的泛化性仍需验证;其次,回顾性设计未能完全模拟术前诊断场景(如小活检标本);此外,单张WSI可能无法充分代表瘤内异质性。未来工作将探索多模态融合(影像学、基因组学)和多幻灯片聚合策略。
该研究的核心价值在于证实了组织病理学图像本身蕴含丰富的淋巴结转移预测信息,并通过定制化Transformer架构实现高效提取。CTMIL框架为计算病理学领域提供了新范式,不仅适用于淋巴结转移预测,未来可扩展至免疫治疗反应、复发风险等更复杂的终点预测任务,推动精准肿瘤学向多模态、可解释方向发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号