
-
生物通官微
陪你抓住生命科技
跳动的脉搏
津巴布韦育龄妇女贫血的社会经济和人口因素:机器学习驱动的预测模型与干预策略
【字体: 大 中 小 】 时间:2025年04月08日 来源:Discover Public Health
编辑推荐:
编辑推荐:本研究针对资源受限国家育龄妇女贫血高发问题,采用机器学习(ML)和SMOTE技术分析2015年津巴布韦人口健康调查(ZDHS)数据,发现年龄、婚姻状况、教育程度等8个关键影响因素,构建的随机森林(RF)模型预测准确率达74%,为精准干预提供数据支持。
贫血作为全球性公共卫生挑战,在资源受限国家呈现"三高一低"特征——高患病率、高疾病负担、高健康风险与低干预效率。津巴布韦作为南部非洲典型代表,2015年育龄妇女贫血率达24.1%,远超WHO定义的5%公共卫生警戒线,却缺乏本土化风险预测工具。Garikayi Chemhaka等学者团队在《Discover Public Health》发表的研究,首次将弹性网络(Elastic Net)特征选择与SMOTE过采样技术结合,构建了适用于津巴布韦国情的贫血预测模型。
研究采用2015年津巴布韦人口健康调查(ZDHS)的5412例育龄妇女数据,通过多阶段抽样确保全国代表性。技术路线呈现三大创新:首先运用卡方检验和多元逻辑回归筛选预测因子,随后采用弹性网络进行特征重要性评分,最后通过SMOTE解决样本不平衡问题后,比较K近邻(KNN)、决策树(DT)和随机森林(RF)三类算法的预测效能。所有分析均使用Stata和Python完成,并采用分层K折验证确保模型稳健性。
研究结果揭示多维度的风险图谱。在人口特征层面,35-49岁女性贫血风险较15-24岁群体显著升高31%(aOR=1.31),而已婚状态具有保护效应(aOR=0.72)。社会经济维度呈现"教育悖论"——高等教育女性风险降低53%,但中等财富阶层反而比贫困群体风险高32%。值得注意的是,职业类型中专业技术人员的贫血风险高达60%,可能与该群体工作压力导致的铁代谢异常相关。在生物医学指标方面,现代避孕药使用(aOR=0.59)和超重肥胖状态(aOR=0.56)均显示保护作用,而马塔贝莱兰南部省份风险飙升至3.44倍,凸显地域差异的显著性。
机器学习模型的比较验证了集成算法的优越性。随机森林在各项指标上全面领先:准确率74%、召回率78%、F1值75%、AUC达81.5%,其性能提升主要源于Bootstrap聚合算法对非线性关系的捕捉能力。特征重要性分析进一步验证了避孕措施、地域分布、BMI和年龄的核心预测价值,与传统统计结果形成互证。
该研究的实践价值体现在三方面:其一建立的预测模型可整合到初级卫生保健系统,实现贫血早期筛查;其二识别的高风险群体为靶向补充铁剂提供依据;其三揭示的地域差异指导资源优化配置。从方法论看,研究开创性地将SMOTE过采样与弹性网络正则化结合,为处理不平衡健康数据提供了新范式。未来研究可结合铁代谢标志物检测,提升模型的生物学解释力,并将算法部署到移动健康平台实现实时风险评估。
这项研究不仅为津巴布韦实现SDG 3.1目标(降低孕产妇死亡率)提供技术支撑,其方法论框架更可推广至其他资源受限地区。随着人工智能在公共卫生领域的深度应用,此类"数据驱动+机器学习"的精准干预模式,或将成为解决全球健康不平等的新利器。
生物通微信公众号
知名企业招聘