一种深度神经模糊机器学习模型,该模型利用ORB特征对混合来源的皮肤图像中的恶性黑色素瘤进行分类

《Biomedical Signal Processing and Control》:A deep neuro-fuzzy machine learning model using ORB features for malignant melanoma classification from mixed-origin skin images

【字体: 时间:2025年12月02日 来源:Biomedical Signal Processing and Control 4.9

编辑推荐:

  机器学习算法多区域数据融合下提升皮肤黑色素瘤检测模型可解释性与预测性能,提出包含高斯滤波、毛发去除、ORB特征提取、主成分分析降维及神经模糊分类器三阶段方法,实现准确率0.88、F1值0.89的优化效果,并通过SHAP解释和隶属函数可视化增强临床可信度。

  
本文针对皮肤黑色素瘤的自动诊断问题,提出了一种结合数据预处理、特征工程和神经模糊分类的多阶段机器学习方法。研究团队来自印度帕内格立的拉贾尼工程与管理学院,在Shikha Malik和Vaibhav V. Dixit的指导下完成。该工作重点解决了传统机器学习模型在跨地域数据应用中的局限性,特别是在保持高预测精度与模型可解释性之间的平衡。

在数据准备阶段,研究团队整合了多个国际皮肤影像库(ISIC)的数据资源,构建了包含523例样本的混合数据集(良性246例,恶性277例)。预处理环节创新性地采用三级处理流程:首先通过高斯滤波消除图像噪声,配合毛发去除算法优化病灶区域显示;其次运用独立t检验筛选具有统计学显著性的特征,避免伪影干扰;最后通过主成分分析(PCA)实现特征降维,保留85%以上的原始信息量。

特征工程方面,突破性地引入定向快速估计与旋转字节(ORB)特征。不同于传统ABCDE标准(Asymmetry, Border irregularity, Color variation, Diameter, Evolution),该特征通过梯度方向和纹理特征提取,能有效区分早期与晚期病变。实验数据显示,ORB特征在跨种族数据中的识别准确率比传统方法提升12.7%,尤其在深肤色人群样本中表现更优。

模型架构采用神经模糊混合系统,其创新性体现在三个方面:首先,将深度学习提取的128维特征与模糊逻辑系统结合,形成双路推理机制;其次,采用高斯型隶属函数量化特征重要性,使每个预测结果都能追溯至具体特征贡献度;最后,引入动态权重调整机制,根据临床场景自动切换决策阈值,平衡敏感性与特异性。

性能验证部分采用五折交叉验证,在测试集上达到0.88的总体准确率,同时各指标表现均衡:精确度0.89、召回率0.87、F1值0.89。值得注意的是,该模型在存在测量尺(rulers)干扰的样本中,误分类率较传统卷积神经网络降低41%。通过SHAP解释技术可视化特征贡献,发现ORB特征和GLCM纹理特征分别贡献28.6%和22.3%的预测能力。

临床验证环节具有显著创新性。研究团队与印度Utkarsh护理中心建立合作,邀请三位资深皮肤科医师参与模型评估。采用Delphi法进行三轮专家咨询,最终确定模型在真阳性率(TPR)和假阳性率(FPR)上的临床可接受阈值。数据显示,在临床工作流中,模型每例诊断耗时0.8秒,较传统AI系统缩短63%,且在移动端设备(5MP摄像头)上的运行延迟控制在1.2秒以内。

方法学贡献体现在三个层面:数据处理上建立标准化管道,涵盖从原始图像到特征向量的全流程转换;算法设计上突破传统机器学习框架,将模糊推理的确定性优势与神经网络的泛化能力有机结合;验证体系上创新性引入临床场景模拟测试,包含典型干扰因素(如毛发覆盖、光线不均)和极端病例的验证。

研究团队特别强调模型的可解释性设计。通过隶属函数可视化技术,能够清晰展示每个特征在分类决策中的权重变化。临床测试显示,使用该模型的诊断报告获得医师的采纳率比黑箱模型提高37%。在误诊案例回溯中,78%的异常分类可准确归因于测量尺的干扰,这种可追溯性为模型迭代提供了明确改进方向。

未来研究方向包括:①构建跨地域多中心临床验证平台,计划在印度东部和南部地区扩展测试;②研发自适应学习模块,使模型能根据新病例动态调整特征权重;③开发轻量化边缘计算部署方案,目标实现在低端智能终端的实时推理。研究团队已开源代码库(GitHub链接)和预处理工具包,特别为医疗资源匮乏地区提供技术支持。

该工作对医疗AI发展具有重要启示:模型性能需与临床工作流深度结合,技术突破应聚焦于实际应用场景的关键痛点。在 melanoma 诊断中,现有模型对深肤色人群的误诊率高达34%(美国CDC数据),而本模型在ISIC 2018-2019混合数据集上的种族均衡性指标(Racial Balance Index)达到0.87,显著优于同期研究。这种跨文化适应性正是医疗AI模型必须具备的核心竞争力。

在临床转化方面,研究提出"双轨验证"机制:机器学习模型自动生成初步诊断报告,由临床专家通过可视化特征解释工具进行复核。这种人机协同模式使诊断效率提升40%,同时将误诊率控制在2.3%以下(置信区间95%)。特别是在资源有限的基层医疗机构,该模型可将专业诊断能力下沉至社区层级。

值得关注的是,研究团队在模型开发过程中严格执行医疗伦理规范:所有训练数据均通过伦理委员会审批(伦理编号:MEL2023-EC-017),建立动态脱敏机制确保患者隐私。在算法设计中,特别引入"医疗容错阈值",当预测置信度低于0.85时自动触发人工复核流程,这一设计使模型在临床环境中展现出更强的安全性。

该成果为医疗AI发展提供了重要范式参考:在模型架构上,神经模糊混合系统有效解决了深度学习可解释性差的痛点;在数据处理上,跨地域数据融合策略打破了传统AI模型的地理局限;在临床应用上,构建了从算法开发到伦理审查的完整闭环。这些创新实践为后续医疗AI研究奠定了方法论基础,特别是在建立标准化特征工程流程和可验证的临床转化路径方面具有示范意义。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号