
-
生物通官微
陪你抓住生命科技
跳动的脉搏
DeepHeme:高性能可泛化的深度集成模型在骨髓形态计量学与血液疾病诊断中的突破性应用
【字体: 大 中 小 】 时间:2025年06月12日 来源:Science Translational Medicine 15.8
编辑推荐:
骨髓涂片细胞形态学分析(BMA)是血液病诊断的关键环节,但传统方法存在耗时长、主观性强等痛点。Sun等开发了基于深度学习集成(DeepHeme)的自动化分类系统,可准确识别23种造血细胞类型。研究通过多中心验证证实其性能媲美血液病理专家(F1=0.92),且在不同扫描系统间展现强泛化能力。这项发表于《Science Translational Medicine》的成果为血液病数字化诊断提供了新范式。
骨髓检查是诊断血液系统疾病的金标准,但传统显微镜下人工分类存在效率低、重复性差等瓶颈。据统计,血液系统恶性肿瘤占全球癌症病例的10%,准确识别骨髓中各类造血细胞对疾病分型、预后评估至关重要。然而,细胞形态学分析高度依赖经验,不同观察者间差异显著,且完整评估单个病例常需数小时。尽管已有研究尝试用人工智能(AI)自动化分类,但普遍存在泛化性不足、罕见细胞识别率低等问题,平均F1评分多低于0.8。
针对这些挑战,加州大学旧金山分校(UCSF)与纪念斯隆凯特琳癌症中心(MSKCC)的研究团队开发了DeepHeme系统。这项发表于《Science Translational Medicine》的研究,通过多专家共识标注的49,977张细胞图像训练深度集成模型,在保留测试集达到专家级精度(F1=0.92),并成功跨越不同医疗机构、扫描设备和疾病谱的验证壁垒。
研究采用三项核心技术:1)基于多中心协作构建含23类造血细胞的标注数据集;2)创新性应用快照集成(snapshot ensemble)技术,通过循环学习率策略在单次训练中获得5个CNN子模型;3)开发兼容医院信息系统(EHR)的临床部署架构。通过加权投票整合子模型预测,显著提升罕见细胞(如嗜碱性粒细胞)的分类性能。
【数据集与深度学习策略】
研究团队与血液病理专家合作,从UCSF和MSKCC获取705例患者的骨髓涂片,使用400×全玻片成像(WSI)系统数字化。通过三阶段标注流程(初标-复核-专家共识)确保数据质量。DeepHeme框架采用ResNeXt50为主干网络,结合20种数据增强策略(包括HE染色模拟)处理类别不平衡问题。
【性能超越现有模型】
在8,507张测试图像上,DeepHeme的加权投票集成方案平均F1达0.92,显著优于独立模型(0.89)和既往研究(C1模型0.78)。特别在"高性能标准"(精确度与召回率均>0.8)的细胞类别数量上,DeepHeme覆盖21类,而对比模型仅覆盖5-15类。
【跨中心泛化能力】
在MSKCC独立队列中,模型面对不同扫描仪(Hamamatsu S360 vs Leica AT2)和疾病谱(含655例恶性肿瘤)时,F1仅从0.92(内部测试)降至0.84。统计学分析显示细胞类型分布存在显著跨中心差异(P<0.001),但模型仍保持稳定性能。
【媲美临床专家】
在与3名血液病理专家的盲法对比中,DeepHeme的平均精确度/召回率(0.91±0.00)优于人类专家(0.78±0.05),且标准差更低。值得注意的是,模型与专家的错误模式高度一致,多发生于发育连续态细胞(如早幼粒与中幼粒细胞)的分类边界。
【生物学意义解读】
通过UMAP降维可视化模型提取的特征,发现其自发重建了造血发育树:原始粒细胞(M1)与原始红细胞(ER1)在拓扑空间相邻,而红细胞系成熟过程中核 ejection 事件对应的形态学突变也反映在特征空间的明显断裂。这种无监督学习获得的生物学相关性,提示DeepHeme可能捕获到尚未量化描述的形态学生物标志物。
在讨论部分,作者指出当前局限包括:1)依赖400×成像,无法解析需油镜观察的细微结构;2)与显微镜摄像头图像兼容性不足。未来计划通过多实例学习(MIL)扩展至全片诊断预测,并探索形态计量特征与临床结局的关联。该研究为血液病数字病理奠定方法学基础,其云端部署平台(https://github.com/sebastianffx/stainlib)和容器化架构设计,将加速临床转化与跨机构协作。
生物通微信公众号
知名企业招聘