编辑推荐:
本研究聚焦于利用机器学习(ML)技术评估健康公平性,通过社会健康决定因素(SDH)预测预期寿命,为政策制定提供数据支持,助力实现健康公平
随着人工智能(AI)和机器学习(ML)技术的飞速发展,其在公共卫生领域的应用逐渐受到关注。健康公平性是全球公共卫生的核心议题之一,而社会健康决定因素(SDH)对健康结果的影响不容忽视。当前,健康不平等问题广泛存在,尤其是在社会经济地位较低的群体中表现更为突出。为解决这一问题,研究人员需要开发出能够精准识别和评估健康公平性的工具,从而为政策制定提供科学依据。
为此,伊朗德黑兰医科大学的研究团队开展了一项开创性的研究,旨在通过机器学习技术构建一个用于健康公平性评估的框架,并以预期寿命作为健康结果指标进行试点研究。该研究利用社会健康决定因素(SDH)数据,通过多种机器学习算法模型,分析其对预期寿命的影响,进而为制定针对性的健康干预政策提供支持。研究结果表明,机器学习模型能够有效识别关键的SDH因素,并准确预测预期寿命。这一研究不仅为健康公平性评估提供了新的技术手段,也为实现全球健康目标提供了有力支持。论文发表在《BioData Mining》上,为相关领域的研究和实践提供了重要参考。
在研究方法方面,研究人员采用了CRISP-ML(Q)模型,这是一种跨行业标准的机器学习流程,结合质量保证方法,涵盖了从项目定义到部署应用维护的六个阶段。研究数据来源于2000年至2020年的全球健康观测站、世界银行和世卫组织东地中海区域办事处,涵盖了140个特征。通过对数据的清洗、转换和特征选择,研究人员将特征数量从140个减少到20个,提高了模型的计算效率和泛化能力。在建模过程中,研究团队采用了数值模型和分类模型两种方法,分别使用了CHAID、线性判别(Linear Discriminant)、逻辑回归(Logistic Regression)和贝叶斯网络(Bayesian Network)等算法。通过对模型性能的评估,线性判别算法因其高准确性和强特征识别能力被选为最佳模型。
研究结果表明,机器学习算法能够有效识别影响预期寿命的关键社会健康决定因素,如当前卫生支出、国内一般政府卫生支出和国内生产总值(GDP)。其中,CHAID算法在数值模型中表现最佳,线性判别算法在分类模型中表现最为突出。这些模型不仅能够准确预测预期寿命的实际值,还能为政策制定者提供关于如何优先考虑和解决健康不平等问题的建议。
在讨论部分,研究强调了在机器学习应用中确保算法公平性的重要性。由于数据偏差可能导致模型预测和干预措施的不公平性,因此需要在数据收集和模型开发过程中采取措施减少偏差。此外,研究还提出了未来研究的方向,包括扩大数据集范围、探索更多机器学习模型(如深度学习技术)以及建立伦理框架以确保AI技术在健康公平性评估中的合理应用。
综上所述,本研究通过构建基于机器学习的健康公平性评估框架,为解决全球健康不平等问题提供了新的思路和方法。该研究不仅展示了机器学习在公共卫生领域的巨大潜力,也为未来相关政策的制定和实施提供了科学依据。