编辑推荐:
多发性骨髓瘤(MM)诊断依赖骨髓涂片分析,人工识别浆细胞存在诸多挑战。研究人员创建 PCMMD 数据集并训练深度神经网络模型。结果显示模型分类性能良好,能辅助诊断。该研究为 MM 诊断提供新途径,推动医学发展。
在医学领域,多发性骨髓瘤(Multiple Myeloma,MM)犹如一颗 “暗雷”,威胁着人们的健康。MM 是一种造血系统恶性肿瘤,源于骨髓中恶性浆细胞(malignant plasma cells,mPCs)的克隆性增殖。目前,MM 的诊断面临着重重困难。按照诊断标准,当骨髓中克隆性浆细胞(plasma cells,PCs)占比≥10% ,或者出现浆细胞瘤(经活检确认),同时伴有高钙血症、肾功能不全、贫血、骨病变等终末器官损伤时,才能确诊为 MM。然而在实际操作中,评估浆细胞与非浆细胞 10% 的比例时,专家们需要在显微镜下一张张地分析血液学玻片,手动识别和计数这些细胞。这一过程不仅耗时费力,需要投入大量的时间和精力,而且结果的准确性极大地依赖专家的注意力和经验。不同专家的判断可能存在差异,导致结果解释不一致,进而影响诊断的敏感性和整体准确性。在医疗资源有限的地区,更是缺乏专业的技术人员,使得疾病的有效筛查和诊断难以开展。这些问题就像一道道难以跨越的沟壑,阻碍着 MM 诊断技术的发展,也让无数患者无法及时得到准确的诊断和有效的治疗。
为了解决这些难题,来自巴西联邦大学巴伊亚分校(Federal University of Bahia)等机构的研究人员踏上了探索之旅。他们开展了一项旨在创建新型数据集和开发自动识别模型,以支持 MM 诊断的研究。最终,他们成功创建了 PCMMD(Plasma Cells for Multiple Myeloma Diagnosis)数据集,并训练出了一种深度神经网络(Deep Neural Network,DNN)模型。这项研究成果发表在《Scientific Data》上,为 MM 的诊断带来了新的曙光。
研究人员在开展研究时,运用了多种关键技术方法。首先,他们依据 CRISP - DM(CRoss - Industry Standard Process for Data Mining)流程,精心收集和整理数据。样本均来自巴西公共卫生系统(Sistema único de Saúde - SUS)确诊和治疗的患者,由专业的血液学专家团队筛选。通过尼康 ECLIPSE CI 可见光光学显微镜搭配智能手机摄像头,拍摄骨髓涂片上的有核细胞,构建原始数据集。之后,专家团队利用 LabelImg 工具,基于细胞形态学特征和 Wright - Giemsa 染色结果,对细胞进行分类标注。在模型构建方面,采用基于 YOLO(You Only Look Once)的 DNN 架构,选用 Ultralytics YOLOv8 版本,通过配置模型、运用迁移学习和微调等技术,让模型学习细胞特征,实现对浆细胞和非浆细胞的自动识别和计数。
下面来详细看看研究结果:
- 数据集构建:PCMMD 数据集分为训练集和测试集。训练集包含 3546 个细胞,其中 54% 为非浆细胞,46% 为浆细胞。这些细胞经过单独分割,去除背景元素,便于分析细胞核数量、细胞形状和膜结构等关键特征。测试集有 2021 个细胞,用于评估模型性能,且根据患者诊断结果进行了分类。
- 模型性能评估:采用计算机视觉(Computer Vision,CV)中目标检测任务的常规评估方法,通过计算交并比(Intersection Over Union,IOU)来估计真阳性(True Positive,TP)、假阳性(False Positive,FP)和假阴性(False Negative,FN)数量。基于 IOU,还计算了模型置信度(Confidence,C)。通过调整阈值,利用 F1 分数等指标评估模型性能。结果显示,模型在五折交叉验证中的平均 F1 分数达到 78% ,在检测和识别浆细胞与非浆细胞的实验中,最佳 F1 分数为 84% ,平均精度均值(mAP50)超过 90%。
- 模型诊断辅助性能:研究人员用训练好的 DNN 模型分析患者玻片,检测、识别并计数浆细胞和非浆细胞,计算两者比例,以此辅助 MM 诊断。与专家诊断结果对比发现,大部分患者的诊断结果一致,仅患者 07 存在差异,模型预测的浆细胞比例略高于实际值,但这种差异在可接受范围内,专家可通过重新计数细胞进行确认。
在研究结论与讨论部分,研究人员创建的 PCMMD 数据集和训练的 DNN 模型具有重要意义。从医学教育角度看,数据集可用于培训新的从业者,为继续医学教育提供支持,帮助未来的专家更准确地识别浆细胞。在技术发展方面,DNN 模型的设计为开发新的细胞识别方法提供了基准,激励科研人员探索更先进的人工智能技术,提升细胞识别的准确性和效率。在临床应用上,结合显微镜和智能手机摄像头的低成本 AI 模型,让先进的诊断技术在资源受限地区也能得以应用,提高了 MM 诊断的可及性。总体而言,这项研究为 MM 的实际诊断带来了显著的改善,为该领域的进一步发展开辟了新的道路,在医学研究和临床实践中都具有极高的价值,有望推动多发性骨髓瘤诊断技术迈向新的台阶,为更多患者带来希望。