编辑推荐:
为解决当前宫颈病变分割算法无法用于大规模快速筛查的问题,河北大学附属医院的研究人员开展了 Light-MDDNet 网络研究。结果显示该网络精度高、速度快。推荐阅读,助你了解前沿的宫颈病变筛查技术。
在全球范围内,宫颈癌可是女性健康的一大 “劲敌”,它在女性癌症新发病例和死亡病例中都排在第四位 ,分别占总发病率和死亡率的 6.5% 和 7.7%。不过,宫颈癌早期治愈率能高达 95% 以上,到了晚期却只有 20 - 50%。这是因为宫颈癌早期没啥明显症状,很难被发现,它也就成了 20 到 39 岁女性癌症死亡的第二大原因。
好在近年来,人工智能技术发展迅速,基于 AI 的宫颈病变分割辅助诊断系统在宫颈癌预筛查中发挥了重要作用。医生可以借助这个系统,更清楚地观察病变情况。研究人员们把目光聚焦在阴道镜图像中低级别鳞状上皮内病变或更严重(LSIL+)区域的分割上,希望能帮医生提高诊断效率和准确性。
像 Praba 等人提出了基于颜色直方图的全自动病变检测方法,先通过预处理去掉无关信息和镜面反射,再提取颜色直方图特征,最后用 KNN、朴素贝叶斯和 SVM 分类器来检测病变区域,分割准确率能超 85%。Liu 等人用 k-means 聚类算法提取宫颈区域,再用基于深度学习的 DeepLab V3 + 图像语义分割模型分割病变区域,平均准确率达到 91.2%。Yue 等人设计了镜面反射去除方法,提出 AWL-CNN 网络,准确率为 90.6%。Yuan 等人用 ResNet 替换 U-Net 的编码部分来分割 LSIL + 区域,醋酸图像的平均准确率达到 95.59%。Yu 等人提出 CLS-Model,用于阴道镜下醋酸处理后的宫颈病变图像中 LSIL + 区域的分割,准确率为 93.04%。
但这些方法都有个大问题,它们大多参数多、计算复杂,用起来速度慢,没办法在大规模宫颈病变筛查中快速处理图像。为了解决这个难题,河北大学附属医院的研究人员在《Scientific Reports》期刊上发表了一篇名为《Light-MDDNet: A Lightweight Network for Real-Time Cervical Lesion Segmentation》的论文。他们提出了一种名为 Light-MDDNet 的轻量级算法分割框架,还把它部署在 JETSON ORIN NX 边缘设备上,成功构建了一个实时辅助筛查系统,在宫颈病变分割和大规模宫颈癌筛查方面取得了不错的成果。这一研究成果意义重大,为宫颈癌的早期诊断和筛查提供了更高效、准确的方法,有望提高宫颈癌的早期发现率,降低死亡率。
研究人员为了实现高效的宫颈病变分割,用到了几个关键技术方法。首先是 MobileNetV2 模块,这是个轻量级深度学习模型,它有线性瓶颈和倒残差结构。线性瓶颈通过 1×1 卷积压缩输入特征图,再进行 3×3 深度可分离卷积,最后用 1×1 卷积恢复特征图深度,倒残差结构则是先扩展再卷积最后压缩。这样的结构能减少计算量和参数数量,还能保持不错的性能。其次是 Denseaspp 模块,阴道镜图像中病变区域形状和尺度多变,传统卷积或池化操作抓不到深层语义信息,Denseaspp 模块就派上用场了。它通过对多个特征图进行空洞卷积,还在每个空洞卷积后添加新的空洞卷积,能提取不同尺度的上下文信息。还有多尺度特征融合(MFF)模块,MobileNetV2 提取特征时会得到多个不同大小的特征图,低级特征位置和细节信息多,但语义低、噪声大;高级特征语义信息强,但感知细节能力差。MFF 模块就能把这些不同尺度的特征图融合起来,让模型更好地识别病变区域。
下面来看看具体的研究结果:
数据收集和准备
研究人员收集了 2019 年 6 月到 2023 年 2 月河北大学附属医院 971 名患者的阴道镜图像,这些图像都是经过醋酸处理后,用来突出宫颈病理病变的,还让妇科肿瘤学家根据病理病变进行了标注。此外,他们还收集了 2023 年 2 月到 2024 年 6 月的 197 名患者的独立数据集,这个数据集没参与模型训练,用来做跨数据集验证,看看模型的泛化能力怎么样。
训练策略
研究人员用一台配备 NVIDIA GTX 2080Ti GPU 的机器来训练模型。他们把阴道镜数据集按 9:1 的比例随机分成训练集和测试集,用交叉熵作为损失函数,随机梯度下降(SGD)优化器来训练网络,设置动量为 0.9,权重衰减为 0.0001,初始学习率为 0.01。为了保证实验公平,所有方法都在相同训练数据上训练,还都用了迁移学习,把 197 张图像的独立数据集专门留出来做跨数据集验证。
模型评估指标
研究人员用了九个指标来评估宫颈病变区域分割的性能,包括像素准确率(PA)、平均像素准确率(MPA)、精度(Pre)、召回率(Re)、平均交并比(MIoU)、骰子系数(Dice)、杰卡德系数(Jaccard)、模型参数(Params)、浮点运算次数(FLOPs)、每秒帧数(FPS)、模型训练时权重文件大小(Weight)和模型测试时每张图像的用时(Time)。
模型部署
研究人员开发了一套流程来部署 Light-MDDNet。先收集图像在服务器上训练深度学习模型,训练完把模型参数冻结,再把模型转换成 ONNX 格式,方便在不同环境部署。接着把 ONNX 模型转换成 Plan File,在 PyTorch 推理引擎里优化。最后把原始阴道镜图像输入 JETSON ORIN NX 移动平台上部署的 Light-MDDNet 网络做实时分割推理,分割结果通过 HDMI 接口显示在监视器上。JETSON ORIN NX 性能很强,计算能力高达 100TOPS,还有 2 x NVDLA v2 深度学习加速器,能满足大规模阴道镜筛查的需求。
在研究的结论和讨论部分,研究人员发现,Light-MDDNet 在和 U-Net、DeepLabV3 + 等五个经典图像语义分割模型的对比中表现出色。在分割性能指标上,它达到或接近顶尖水平,在效率指标上也远超其他模型,尤其是在跨数据集验证中,MIoU 达到 83.23%,比传统的 U-Net 和 DeeplabV3 + 都有显著提升,在其他评估指标上也保持高性能。通过消融实验,研究人员还发现模型各个组件都很重要,组合在一起能让模型准确率和处理速度都得到提升。
总的来说,这项研究意义非凡。Light-MDDNet 在效率和准确性上都超越了之前的模型,在大规模宫颈病变筛查中展现出巨大潜力,为宫颈癌临床诊断的进步带来了新希望。不过,研究也有局限,公开可用且带足够分割标签的数据集太少,限制了对模型泛化能力的全面评估。但这并不影响它为未来宫颈癌筛查技术的发展打下坚实基础,相信在未来,随着技术的不断完善和数据集的丰富,宫颈癌的早期筛查会变得更加精准、高效,为女性健康保驾护航。
下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究
10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!
欢迎下载Twist《不断变化的CRISPR筛选格局》电子书
单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析
下载《细胞内蛋白质互作分析方法电子书》