为解决这些难题,由清华大学戴琼海院士、吴天阴教授、徐枫教授与广州医科大学附属第一医院何建行教授领衔的研究团队,在《Nature Communications》发表了题为"A lung CT vision foundation model facilitating disease diagnosis and medical imaging"的研究。该研究构建了迄今规模最大的肺CT数据集LungCT-28M(包含105,184次扫描、2800万图像),并在此基础上开发了基于去噪扩散概率模型(DDPM)的视觉基础模型LCTfound。这一模型通过自监督学习方式,将影像参数(如窗宽、窗位)与临床信息作为条件引导,实现了从疾病诊断到影像质量提升的多任务统一处理框架。关键技术方法包括:1) 基于五中心485,885例CT扫描构建LungCT-28M预训练数据集,通过自然语言处理(NLP)模型自动提取诊断标签;2) 采用融合Transformer模块的U-Net架构(参数量200M),以DDPM策略进行条件扩散预训练;3) 针对不同下游任务设计适配器,如多层感知机(MLP)用于分类任务,冷扩散方法用于低剂量CT增强;4) 在多中心数据集上验证8类任务性能,包括纵隔肿瘤分割、非小细胞肺癌(NSCLC)预后预测、虚拟CT血管成像(CTA)、稀疏视图重建等。LCTfound促进疾病诊断与预后评估在NSCLC预后预测任务中,LCTfound在LUNG1数据集上展现出最优的生存分层能力(P<0.001)。通过梯度加权类激活映射(Grad-CAM)可视化显示,模型注意力集中于病变区域,印证其临床相关性。对于新辅助化疗免疫治疗的病理反应预测,LCTfound在内部和外部测试集上的曲线下面积(AUROC)均领先于MAE、RadImageNet等基线模型。