使用动态红外热成像技术对用于乳腺癌检测的自编码器架构进行比较分析
《Engineering Science and Technology, an International Journal》:Comparative analysis of autoencoder architectures for breast cancer detection using dynamic infrared thermography
【字体:
大
中
小
】
时间:2025年11月11日
来源:Engineering Science and Technology, an International Journal 5.1
编辑推荐:
乳腺癌早期检测:红外热成像与深度学习自动编码器融合诊断框架研究。该研究提出采用范埃、卷积自动编码器和变分自编码器提取乳腺红外热成像特征,结合支持向量机与随机森林分类器,在3,600例动态红外热成像数据集上验证。结果显示,卷积自动编码器(CAE)与支持向量机(SVM)组合实现最高准确率92.56%,灵敏度89.11%,特异度95.94%,F1值92.26%,且训练时间最短(7.8分钟)。相比传统方法,该框架无需预训练特征或数据增强,通过直接学习热成像数据的空间和温度特征,在资源受限环境中展现高精度、高效率和可解释性优势。
乳腺癌是全球女性中最常被诊断出的癌症类型之一,其诊断和治疗效果与早期发现密切相关。随着医疗技术的发展,乳腺癌的早期检测方法逐渐从传统的影像学技术向更安全、经济的非侵入式技术转变。尽管乳腺X线摄影、计算机断层扫描(CT)、磁共振成像(MRI)和超声波等传统影像技术在乳腺癌筛查中发挥着重要作用,但它们通常伴随着辐射暴露、高昂的成本和对造影剂的依赖,这些限制促使了对非侵入式和经济有效的替代方案的研究。其中,红外热成像(Infrared Thermal Imaging, ITI)因其无辐射、低成本、非接触式和快速等优点,成为一种有前景的替代方法。ITI通过捕捉皮肤表面的温度变化来检测潜在的恶性病变,其原理基于黑体辐射理论,表明人体皮肤具有高发射率,能够像理想黑体一样准确测量温度变化。这些温度差异在乳腺癌中可能表现为代谢活动增强、血管生成增加、血流变化和血管扩张等生理变化。
为了提高ITI在乳腺癌诊断中的性能,本研究提出了一种基于深度学习的特征提取与传统机器学习分类器相结合的新框架。该框架采用三种自编码器(Autoencoder, AE)架构:普通自编码器(Vanilla Autoencoder, VanAE)、卷积自编码器(Convolutional Autoencoder, CAE)和变分自编码器(Variational Autoencoder, VAE)。这些自编码器模型用于从动态乳腺热图中提取具有判别性的潜在特征,然后通过支持向量机(Support Vector Machine, SVM)和随机森林(Random Forest, RF)等传统机器学习分类器进行分类。实验评估在平衡的DMR-IR动态数据集上进行,该数据集包含3600张热图,涵盖了90名健康个体和90名患病个体,每组各有1800张热图。结果表明,CAE-SVM组合在所有评估指标中表现最佳,达到了92.28%的准确率、89.11%的灵敏度、95.94%的特异性和92.26%的F1分数。此外,CAE模型在训练时间上也表现出显著优势,显示出其在实际临床应用中的潜力。
本研究的创新点在于系统比较了三种自编码器模型在乳腺癌诊断中的表现,并评估了它们与不同分类器的兼容性。相比以往研究中仅关注单一自编码器模型或分类器,本研究建立了一个统一的评估框架,以探讨不同自编码器变体和分类策略的诊断性能。通过分析不同模型在提取潜在特征方面的表现,研究揭示了CAE在乳腺热图分析中的优势。CAE通过卷积层保留了输入图像的空间结构,同时抑制了噪声,使其能够捕捉细微的温度变化和结构不对称性。这种结构使得CAE在所有评估指标中表现最优,同时具备良好的计算效率。
相比之下,普通自编码器(VanAE)虽然结构简单,但在分类性能上表现较弱,尤其是在处理复杂的空间和温度模式时,其提取的特征不足以提供足够的判别能力。此外,VanAE的计算成本较高,训练时间较长,限制了其在资源受限环境中的应用。而变分自编码器(VAE)虽然在结构上引入了概率框架,使其在特征学习过程中具有更强的鲁棒性和泛化能力,但其对局部温度变化的敏感度较低,导致其在某些情况下表现不如CAE。尽管如此,VAE在计算效率和模型可解释性方面具有一定的优势,尤其是在数据有限的情况下,其结构化的潜在特征分布有助于提高分类性能。
本研究还对自编码器的训练配置和计算环境进行了详细分析。所有模型均使用Keras API和TensorFlow作为后端进行训练,实验在Google Colab平台上进行,利用V6 TPU配置提供充足的计算资源。为了确保模型的稳定性和泛化能力,研究对关键超参数进行了系统优化,包括潜在特征维度、网络深度、损失函数和优化方法、神经元配置以及训练轮次和时间。通过这些调整,研究确保了不同自编码器模型之间的公平比较,并突出了CAE在实际应用中的优越性。
在分类性能的分析中,研究采用了SVM和RF两种分类器,以全面评估自编码器提取的潜在特征。结果表明,CAE-SVM组合在所有指标中均表现最佳,具有较高的分类准确性和稳定性。这进一步验证了卷积自编码器在乳腺热图分析中的有效性,尤其是在捕捉复杂的空间和温度模式方面。相比之下,其他模型如VanAE和VAE虽然在某些情况下表现尚可,但其性能和稳定性均不及CAE。此外,研究还对已有的相关文献进行了回顾,发现许多早期研究使用的数据集规模较小,限制了其结果的统计效力和泛化能力。而本研究使用的DMR-IR数据集具有较大的样本量和良好的平衡性,能够更准确地评估模型的性能。
在模型的计算效率方面,研究对每种自编码器的训练时间进行了详细记录。CAE的训练时间最短,仅需约4.7秒每轮(90步,每步约52毫秒),而VanAE的训练时间最长,约27.7秒每轮(约308毫秒每步)。这种差异反映了不同模型在结构复杂度和计算负载上的区别。尽管VanAE在某些方面表现出较高的特征提取能力,但其较高的计算成本限制了其在实际临床中的应用。而CAE在保持高分类性能的同时,具备良好的计算效率,使其成为一种在资源受限环境中可行的解决方案。
本研究还对基于迁移学习的特征提取方法进行了补充分析,包括DenseNet121、DenseNet201、VGG16、InceptionV3、MobileNet和ResNet等模型。这些模型通常使用ImageNet预训练权重,并通过移除原始的全连接分类层,替换为Flatten层和Dense层,以提取固定长度的潜在特征。尽管迁移学习在医疗影像分析中表现出良好的性能,但其特征提取通常基于自然图像,而乳腺热图具有不同的温度分布和空间结构。因此,基于迁移学习的特征可能无法有效捕捉乳腺热图中的细微温度变化和结构不对称性,从而影响分类的准确性。相比之下,本研究提出的CAE模型直接从原始热图数据中学习特征,能够更准确地捕捉与乳腺癌相关的生理变化,从而提高了诊断的可靠性。
在临床应用方面,ITI作为一种无辐射、非接触式的成像方法,具有广泛的应用前景。它特别适用于那些对辐射敏感的患者,如孕妇、哺乳期女性或有植入物的个体。然而,ITI在检测小型或深层肿瘤方面仍存在一定的挑战,主要是由于热信号衰减和皮肤表面热对比度降低。因此,如何提高ITI在这些情况下的检测能力,是未来研究的重要方向。此外,ITI的诊断效果还受到环境因素的影响,如温度波动和湿度变化,这些因素可能影响热图的质量和稳定性。因此,环境标准化对于提高ITI的临床实用性至关重要。
本研究的结果表明,基于自编码器的特征提取框架在乳腺癌的早期检测中具有显著优势。CAE-SVM组合不仅在分类性能上表现最佳,而且在计算效率上也具有竞争力,能够在有限的计算资源下实现高精度的诊断。这为在资源受限的临床环境中部署自动化的乳腺癌筛查系统提供了重要的技术支持。此外,研究还强调了模型的可解释性,即CAE提取的潜在特征能够直观地反映乳腺组织的温度分布和结构变化,有助于临床医生理解模型的决策过程。
综上所述,本研究提出了一种结合深度学习特征提取和传统机器学习分类器的乳腺癌诊断框架,通过对比三种自编码器模型的性能,验证了CAE在乳腺热图分析中的优越性。研究结果不仅为乳腺癌的早期检测提供了新的方法,也为ITI在实际临床中的应用提供了理论依据和技术支持。未来的研究可以进一步探索更复杂的模型结构,以提高对乳腺热图中细微特征的捕捉能力,同时结合时间动态和解剖学特征,以增强模型的鲁棒性和泛化能力。此外,研究还可以扩展到更大规模和更异质的数据集,以验证模型在不同人群和临床条件下的适用性。通过这些努力,ITI有望成为乳腺癌筛查的重要工具,为患者提供更安全、高效和经济的诊断方案。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号