编辑推荐:
心力衰竭严重威胁人类健康,治疗成本高昂。研究人员开展了 “使用投票集成学习模型和新型数据归一化技术预测心力衰竭” 的研究。结果显示新方法提升了模型性能,最高准确率达 95.6522% 。这为心力衰竭预测提供了更有效手段。
在全球范围内,心脏疾病是危害人类健康的 “头号杀手”,其中心力衰竭更是让无数患者深受折磨。心力衰竭患者常伴有呼吸急促、疲劳等症状,不仅频繁住院,生活质量大打折扣,寿命也明显缩短。据统计,发达国家约 1% - 2% 的成年人受其影响,全球有 2600 多万人患病,70 岁以上人群患病率更是高达 10% 以上,且患病人数还在逐年攀升,治疗费用也水涨船高。因此,早期精准预测心力衰竭就显得尤为重要,它能帮助患者及时干预,降低并发症风险,减少治疗费用。
然而,由于心力衰竭发病机制复杂,个体风险因素差异大,开发精准的预测模型困难重重。尽管机器学习技术已广泛应用于该领域,但模型性能受数据预处理质量影响极大。在此背景下,来自越南胡志明市阮文灵大学(Nguyen Tat Thanh University)的研究人员开展了一项关于 “使用投票集成学习模型和新型数据归一化技术预测心力衰竭” 的研究,其研究成果发表在《Engineering Applications of Artificial Intelligence》上。
研究人员采用了一系列关键技术方法。首先,他们使用了包含 918 个样本、11 个特征的临床数据集,该数据集由 5 个子数据集(Cleveland、Hungarian、Switzerland、Long Beach 和 Stalog 数据集)整合而成。在数据预处理环节,除了传统的 Min - Max 缩放器,研究人员创新性地提出了两种新型数据归一化方法:Squash - Norm 和 Squash - Norm - Sigmoid。此外,研究选用了 6 种单机学习模型,包括逻辑回归(Logistic Regression,LR)、支持向量机(Support Vector Machine,SVM)、轻量级梯度提升机(Light Gradient - Boosting Machine,LGBM)、随机森林(Random Forest,RF)、极端梯度提升(eXtreme Gradient Boosting,XGBoost)和决策树(Decision Tree,DT),并运用软投票集成学习技术(Soft Voting Classifier)将多个模型结合起来。
实验结果
- 单机学习模型性能提升:将 Squash - Norm 和 Squash - Norm - Sigmoid 归一化技术应用于 6 种单机学习模型后,与使用 Min - Max 缩放器相比,准确率(Accuracy)、召回率(Recall)、F1 分数(F1 - Score)和平衡准确率(Balanced Accuracy)等指标均显著提高。其中,使用这两种归一化技术的单机学习模型最高准确率达到 94.0217%。
- 集成学习模型效果显著:在集成学习模型方面,应用 Squash - Norm 和 Squash - Norm - Sigmoid 归一化技术后,各项指标同样有大幅提升。采用这两种归一化技术的集成模型峰值准确率达到 95.6522%。
研究结论与讨论
研究表明,Squash - Norm 和 Squash - Norm - Sigmoid 这两种新型数据归一化方法在心力衰竭预测中表现卓越。它们在将数据压缩到统一尺度的过程中,不会丢失向量方向,有效提升了模型性能。与传统方法相比,新方法使模型准确率提高了 5% - 8%。这一研究成果意义重大,不仅为心力衰竭的早期预测提供了更精准、有效的手段,有望改善患者的治疗效果和生活质量,还为其他机器学习任务中的数据处理提供了新思路和方法,具有广阔的应用前景。它推动了人工智能技术在医学领域的深入应用,为攻克更多复杂疾病的预测难题提供了有力支持,也为后续相关研究奠定了坚实基础。