
-
生物通官微
陪你抓住生命科技
跳动的脉搏
多目标混合哈里斯鹰优化算法(MO-hHHO)在冠心病预测中的创新应用与性能提升
【字体: 大 中 小 】 时间:2025年08月04日 来源:Advanced Intelligent Systems 6.1
编辑推荐:
本文创新性地提出多目标混合哈里斯鹰优化算法(MO-hHHO),通过特征选择最小化和分类器超参数优化双重策略,显著提升冠心病(CAD)预测准确率。研究采用随机森林(RF)、K近邻(KNN)、逻辑回归(LR)和支持向量机(SVM)四种机器学习分类器,在Kaggle心脏疾病数据集上验证了算法有效性,特别在RF、LR和SVM分类器中取得91.3%-93.7%的优异准确率。该混合算法通过引入速度因子(V)和新型逃逸能量方程(E),有效平衡探索与开发阶段,为高维复杂优化任务提供新解决方案。
多目标混合哈里斯鹰优化算法在冠心病预测中的应用研究
背景与意义
心血管疾病(CVD)每年导致约1790万死亡病例,占全球总死亡人数的30%。其中冠状动脉疾病(CAD)作为CVD中死亡率最高的类型,其早期准确诊断对临床治疗至关重要。传统诊断方法存在局限性,而机器学习(ML)与人工智能(AI)技术为CAD预测提供了新思路。然而,高维数据中的冗余特征和分类器超参数选择问题严重制约模型性能。本研究针对这些挑战,开发了创新的多目标混合哈里斯鹰优化算法(MO-hHHO)。
算法创新与改进
标准哈里斯鹰优化(HHO)算法存在早熟收敛、探索-开发失衡等问题。MO-hHHO通过三项关键改进突破局限:
引入粒子群优化(PSO)的速度因子(V),增强位置更新机制
设计新型逃逸能量方程(E):E = Emax - (Emax-Emin)(t/T)
开发探索因子(ef):ef = 0.5(1+cos(πt/T))
这些改进使算法在Kaggle提供的13个临床特征数据集上展现出优越性能。数据预处理阶段采用SVM-SMOTE技术解决样本不平衡问题,将正负样本比例从120:150调整为平衡分布。
实验设计与结果
研究采用四阶段验证方案:
固定超参数下的特征选择
全特征下的超参数调优
多目标联合优化
分类器性能评估
关键发现:
特征选择阶段:H-HHO优化后的分类器显著优于标准HHO,其中H-HHO-LR获得最高准确率93.7%±2.3
超参数调优阶段:H-HHO-SVM表现最佳(94.26%±1.46),Wilcoxon检验p<0.05验证显著性
多目标优化阶段:H-HHO-SVM实现97.9%±3.3的召回率和92.9%±1.7的精确度
性能对比分析
各分类器在MO-hHHO优化下的表现:
支持向量机(SVM):
准确率提升9.7个百分点(84.4%→94.1%)
但训练时间达15784.5秒,计算成本最高
逻辑回归(LR):
保持92.8%±1.6的高准确率
训练时间仅35.2秒,性价比最优
随机森林(RF):
准确率91.2%±2.5
特征重要性分析提供临床解释性
K近邻(KNN):
改进幅度最小(81.9%→84.1%)
但6.8秒的训练速度最快
ROC曲线分析显示,优化后模型的AUC值普遍超过0.9,证实算法有效提升分类性能。
临床应用价值
MO-hHHO算法通过双重优化策略:
平均减少40%的特征维度
关键临床指标识别:
年龄、胆固醇水平、血压等
超参数自动优化:
SVM的核函数参数
RF的树深度和数量
LR的正则化系数
这种自动化优化流程极大降低了临床医生的技术门槛,为CAD早期筛查提供可靠工具。
局限性与未来方向
当前研究存在两方面局限:
计算效率:SVM优化耗时较长
数据规模:仅270个临床样本
未来工作将聚焦:
引入超启发式框架
整合灰狼优化(GWO)、蝙蝠算法(BA)等
扩展至多模态医疗数据
开发分布式计算方案
结语
MO-hHHO算法通过创新的生物启发式策略,在CAD预测领域实现了特征选择与超参数调优的协同优化。实验证明其在保持模型简洁性的同时显著提升分类性能,为临床决策支持系统提供了新的技术路径。该研究不仅推进了智能医疗诊断技术的发展,也为解决其他高维生物医学数据的优化问题提供了方法论参考。
生物通微信公众号
知名企业招聘