基于自监督学习的结直肠癌CT影像基础模型CRCFound:突破标注数据限制的精准诊疗新范式

【字体: 时间:2025年08月14日 来源:Advanced Science 14.1

编辑推荐:

  本文创新性地提出基于自监督学习(SSL)的结直肠癌(CRC)CT影像基础模型CRCFound,通过5137例无标注CT图像预训练,构建可迁移多任务的通用特征表征体系。该模型在TNM分期、微卫星不稳定性(MSI)、共识分子分型(CMS)等6项诊断任务和总生存期(OS)、无病生存期(DFS)2项预后任务中展现卓越性能(平均AUROC达0.83-0.95),显著优于传统监督学习模型(提升达22%),为解决医学影像标注稀缺难题提供突破性方案。

  

突破标注瓶颈的CRC智能诊疗革命

在结直肠癌(CRC)诊疗领域,精准的风险分层始终面临重大挑战。传统TNM分期依赖术后病理,而微卫星不稳定性(MSI)和共识分子分型(CMS)等生物标志物检测成本高昂且难以术前获取。CT影像虽蕴含丰富信息,但现有深度学习模型受限于标注数据匮乏,泛化能力不足。CRCFound的诞生为这一困境带来转机。

自监督预训练架构创新

研究团队采用掩码自编码器(MAE)框架,在5137例无标注CRC CT图像上开展3D块掩码重建预训练。编码器采用Vision Transformer(ViT)架构,通过75%高掩码率迫使模型学习深层解剖关联;轻量化解码器则专注于图像重建。这种非对称设计使模型能捕捉从局部病灶到全局解剖结构的跨尺度特征,为后续多任务迁移奠定基础。

多维度临床验证表现

在TNM分期任务中,融合放射学报告的CRCFound_report模型展现惊人准确度:T3-T4分期AUROC达0.889,N分期0.847,远优于传统监督模型(提升19.9-22%)。可视化分析显示,模型能精确定位微小肿瘤(<2cm)和转移淋巴结,而传统模型注意力分散。外部验证进一步证实其泛化能力,在独立数据集T/N分期AUROC保持0.762-0.827。

分子特征解码突破

对于MSI状态预测,模型AUROC高达0.952,较基线提升10.1%。CMS分型任务中,免疫激活型(CMS1)识别准确度尤为突出。值得注意的是,模型仅凭CT影像即可捕捉分子特征,为无创生物标记检测开辟新途径。特征聚类分析揭示,预训练使样本在嵌入空间呈现清晰类别边界,而传统方法存在严重重叠。

生存预测临床价值

在预后方面,CRCFound_CT风险评分对DFS和OS的预测HR值分别达4.62和7.78(p<0.001)。多变量分析显示,该评分是独立于TNM分期的预后因子(HR=2.5-3.4),较临床指标更具预测效力。Kaplan-Meier曲线清晰区分高低风险组,为个体化治疗提供量化依据。

跨模态融合优势

研究创新性整合CT影像与放射学报告,通过ChatGLM-6B模型提取文本特征。在T分期任务中,多模态融合使模型置信度显著提升,尤其对疑难病例的判断更为可靠。这种融合策略将放射科医生的语义描述与深度学习特征有机结合,实现"1+1>2"的协同效应。

技术突破与局限

相比既往AG-CRC等模型局限于肿瘤区域分割,CRCFound的全局掩码重建策略使其能学习病灶-环境的交互特征。适配器(Adapter)模块的引入实现参数高效微调,新任务扩展成本降低80%。但研究也承认局限性:数据来源单一,未纳入MRI等多模态信息,跨中心验证尚待加强。

这项发表于《Advanced Science》的工作标志着CRC诊疗进入基础模型时代。通过开放预训练权重,研究团队期待推动社区共同发展,最终实现从精准诊断到个体化治疗的闭环。未来整合多组学数据和动态随访信息,或将重塑消化道肿瘤的全程管理范式。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号