综述:机器学习方法的有效性和特定部位性能评估:自闭症检测模型的综合回顾

【字体: 时间:2025年05月20日 来源:Franklin Open

编辑推荐:

  本综述聚焦自闭症(ASD)早期检测,分析 22 项研究中 18 个机器学习(ML)模型及 4 种先进方法(如 CNN、DASD 等)。对比其准确率、处理时间等,发现 LR 高效,CNN 适合神经影像检测,为优化 ASD 预测模型提供方向。

  

1. 引言


自闭症谱系障碍(ASD)是一种复杂的神经发育障碍,以社交互动、沟通和重复行为困难为特征。早期准确诊断对及时干预至关重要,传统行为评估耗时、主观且在许多医疗环境中不可及。机器学习(ML)可分析大量数据并识别模式,在 ASD 诊断中显示出潜力,但其效果因数据集特征、特征选择和模型复杂性而异。

现有研究存在参数调优繁琐(如 XGB)、过拟合风险(如 DT)、假设条件独立性(如 GNB)等不足。尽管有综述探讨了多种 ML 模型,但缺乏对逻辑回归(LR)和集成方法的深入评估,且未充分关注特征重要性和模型可解释性。本综述全面评估 ASD 检测中的 ML 方法,包括传统分类器、集成学习和深度学习(DL)架构,旨在为研究人员提供结构化理解,并探索未来研究方向。

2. 文献综述


ASD 的早期识别和干预对改善长期预后至关重要,传统诊断方法依赖主观评估,导致识别延迟,推动了 ML 算法在 ASD 诊断中的研究。

2.1 研究方法与数据集


研究分析了 22 项研究,涉及 RF、GB、LR、KNN、SVM、DT、GNB、MLP、AB、XGB、LGB、CB、Bagging、ET 等 14 个 ML 模型,以及 CNN、DASD、EKNN、SOM 等先进方法。数据集包括行为、神经影像(如 ABIDE I 存储库的 fMRI 数据)、遗传和电子健康记录(EHR)数据,涵盖不同年龄组(幼儿、儿童、青少年、成人)。

2.2 主要模型性能


  • 传统 ML 模型:LR 在高准确率下处理时间较少,适合效率驱动的应用;RF、XGB、GB、LGB 等集成学习模型表现出色,最高准确率达 100%。
  • 深度学习模型:CNN 在神经影像数据中表现优异,准确率达 99.39%,但存在可解释性和多模态集成挑战。
  • 其他方法:SOM 用于数据聚类,DASD 策略结合优化算法和集成诊断方法,在血液检测数据中准确率达 93%。

2.3 挑战与进展


当前挑战包括类分布不平衡、模型可解释性差、数据集不标准化等。进展体现在探索集成方法、特征工程和多模态数据融合,以提高预测的全面性。

3. 方法论


3.1 研究选择标准


从多个学术来源系统收集 2018-2023 年发表的英文研究,聚焦 ASD 检测的 ML 和 DL 算法,最终纳入 22 项研究。

3.2 数据描述


使用 “Autism Diagnosis” 数据集评估模型性能,其他数据集包括 ABIDE、幼儿和成人数据集、PDDBI 等,涵盖行为、生物标志物(如血液中的 K?、GST、LDH 等)和神经影像特征。

3.3 所选 ML 模型概述


  • 分类算法:LR、RF、SVM 等在不同数据集和年龄组中表现各异,RF 在成人 ASD 检测中准确率达 99%,LR 在幼儿行为数据中准确率 100%。
  • 集成与优化方法:AB、XGB 等集成模型通过组合多个分类器提高准确率,如 AB 在幼儿数据中准确率 99.25%;优化算法(如 BGWO、BGA)用于特征选择和数据精炼。
  • 深度学习:CNN 用于 fMRI 数据,通过卷积、池化等层提取特征,实现 99.39% 的准确率;Auto-ASD-Network 结合 MLP 和 SVM,利用 SMOTE 进行数据增强。

4. 结果与发现


4.1 模型性能比较


  • 准确率:RF、GB、XGB、LGB、AB 等集成模型在多个研究中达到 100% 准确率;CNN 在神经影像中准确率 99.39%;LR 在行为数据中效率高且准确。
  • 计算成本:LR 训练时间仅 0.0054 秒,KNN 预测速度快但精度较低;CB 训练时间最长(1.746 秒)。

4.2 关键发现


  • 模型选择应权衡准确率和处理时间,如 LR 适合快速筛查,CNN 适合神经影像分析。
  • 多模态数据融合(行为、影像、生物标志物)和可解释 AI(XAI)是未来研究方向,以提高模型的临床适用性和可信度。

5. 讨论


模型有效性受年龄组、数据集特征和研究目标影响。LR、RF 等传统模型在行为数据中表现良好,CNN 在神经影像中优势显著,但均面临可解释性和数据集偏差问题。未来需整合多模态数据,优化计算效率,加强外部验证和伦理考量(如数据隐私、公平性)。

6. 结论


本综述全面评估了 ASD 检测中的 ML 方法,发现集成学习和 DL 模型在准确率上表现突出,但需根据具体需求选择模型。未来研究应注重算法鲁棒性、伦理问题和多学科协作,以开发更准确、可解释和可及的 ASD 检测工具。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号