LCTfound:基于扩散预训练的全肺CT视觉基础模型在疾病诊断与影像增强中的突破性应用

《Nature Communications》:A lung CT vision foundation model facilitating disease diagnosis and medical imaging

【字体: 时间:2025年12月05日 来源:Nature Communications 15.7

编辑推荐:

  本研究针对肺CT影像标注数据稀缺及现有模型生成能力有限等临床挑战,开发了基于105,184例CT扫描训练的LCTfound基础模型。该模型通过扩散预训练联合编码影像与临床信息,在8项任务中超越基线模型:罕见病诊断(纵隔肿瘤Dice 0.7895)、NSCLC预后预测(P<0.001)、虚拟CTA(PSNR 21.14)、稀疏重建(LPIPS 0.0153)等,为精准医疗提供可部署的一体化解决方案。

  
在全球每年数亿次的肺部CT检查中,人工智能(AI)正逐渐成为辅助医生诊断疾病、规划手术的重要工具。然而,当前医疗AI的发展面临两大瓶颈:一是高质量标注数据严重匮乏,特别是对于纵隔肿瘤、肺泡蛋白沉积症(PAP)等罕见疾病,获取足够病例训练模型极为困难;二是现有模型多针对单一任务开发,泛化能力有限,且在图像质量增强、三维重建等需要像素级处理的任务上表现不佳。这些限制使得AI在真实临床场景中的广泛应用受到制约。
为解决这些难题,由清华大学戴琼海院士、吴天阴教授、徐枫教授与广州医科大学附属第一医院何建行教授领衔的研究团队,在《Nature Communications》发表了题为"A lung CT vision foundation model facilitating disease diagnosis and medical imaging"的研究。该研究构建了迄今规模最大的肺CT数据集LungCT-28M(包含105,184次扫描、2800万图像),并在此基础上开发了基于去噪扩散概率模型(DDPM)的视觉基础模型LCTfound。这一模型通过自监督学习方式,将影像参数(如窗宽、窗位)与临床信息作为条件引导,实现了从疾病诊断到影像质量提升的多任务统一处理框架。
关键技术方法包括:1) 基于五中心485,885例CT扫描构建LungCT-28M预训练数据集,通过自然语言处理(NLP)模型自动提取诊断标签;2) 采用融合Transformer模块的U-Net架构(参数量200M),以DDPM策略进行条件扩散预训练;3) 针对不同下游任务设计适配器,如多层感知机(MLP)用于分类任务,冷扩散方法用于低剂量CT增强;4) 在多中心数据集上验证8类任务性能,包括纵隔肿瘤分割、非小细胞肺癌(NSCLC)预后预测、虚拟CT血管成像(CTA)、稀疏视图重建等。
LCTfound促进疾病诊断与预后评估
在NSCLC预后预测任务中,LCTfound在LUNG1数据集上展现出最优的生存分层能力(P<0.001)。通过梯度加权类激活映射(Grad-CAM)可视化显示,模型注意力集中于病变区域,印证其临床相关性。对于新辅助化疗免疫治疗的病理反应预测,LCTfound在内部和外部测试集上的曲线下面积(AUROC)均领先于MAE、RadImageNet等基线模型。
在罕见病诊断方面,针对发病率为百万分之0.2的肺泡蛋白沉积症(PAP),LCTfound在仅使用297例训练数据时AUROC达0.9532,较次优模型提升6.01%。对于解剖结构复杂的纵隔肿瘤分割任务,在五个外部测试集上Dice系数平均提升3.73%,显著优于MedSAM、MAE等通用医学影像模型。
LCTfound增强三维建模与AI辅助手术导航
研究团队在全肺三维建模中定义了21个解剖结构(如支气管、动静脉等)。LCTfound在所有结构的语义分割任务中均取得最优结果,特别是在气管、细小血管等复杂结构上误差显著降低。通过云平台部署的交互式网站(https://demo.lctfound.com)已实现临床转化,为肺结节精准切除手术提供导航支持。
LCTfound支持多场景影像增强
在影像质量提升方面,LCTfound展现出强大的生成能力:虚拟CTA任务中,峰值信噪比(PSNR)达21.14,较条件扩散模型提升12.9%;在16视图稀疏重建任务中,LPIPS指标降至0.0153,显著优于DuDoTrans等专用重建算法;低剂量CT增强任务(5%剂量)在六项指标中全面领先。值得注意的是,基于LCTfound重建图像训练的纵隔肿瘤分割模型,性能接近原始全视图CT数据,证实其增强结果的临床可用性。
研究结论指出,LCTfound作为首个基于扩散模型的肺CT基础模型,成功实现了诊断性任务与生成性任务的统一。其创新性体现在:1) 通过条件扩散预训练融合影像与临床信息;2) 在像素级任务中保持解剖结构一致性;3) 支持少样本场景下的快速适配。作者同时指出模型存在计算效率待优化、未整合多模态信息等局限,未来将向三维架构与语言模型融合方向演进。该研究为医学基础模型提供了新范式,其开源策略(https://github.com/gingerbread000/LCTfound)将加速医疗AI的临床落地。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号