编辑推荐:
为解决埃塞俄比亚儿童营养问题,研究人员开展利用可解释人工智能(XAI)改进机器学习模型预测饮食多样性的研究,结果显示集成机器学习模型预测性能良好,该研究为相关政策制定等提供依据。
在埃塞俄比亚,儿童营养问题一直备受关注,尤其是学龄前儿童的饮食健康。充足且多样的饮食对于孩子们获取各种必要营养、维持良好健康状况至关重要。然而现实却令人担忧,许多埃塞俄比亚儿童无法获得丰富多样的食物,这直接导致了营养不良以及其他健康问题的出现。
在科技飞速发展的当下,机器学习(ML)技术在分析大量数据方面展现出巨大潜力。但该技术在实际应用中存在一个明显的短板 —— 缺乏透明度。在公共健康领域,这一问题可能会严重影响其应用效果。例如,在预测儿童饮食多样性水平时,如果模型无法清晰解释其预测依据,相关决策人员就难以据此制定出有效的政策和干预措施。因此,为了更准确地预测埃塞俄比亚学龄前儿童的饮食多样性水平,研究人员开展了一项极具意义的研究。
来自 Debark University 和 University of Gondar 的研究人员 Gizachew Mulu Setegn 和 Belayneh Endalamaw Dejene,致力于探索如何通过集成可解释人工智能(XAI)方法来提升机器学习模型的性能。该研究成果发表在《Italian Journal of Pediatrics》上。
研究人员为开展此项研究,采用了多种关键技术方法。数据来源于埃塞俄比亚人口与健康调查(EDHS),涵盖了丰富的人口统计信息、社会经济因素以及食物消费模式数据。在数据处理过程中,进行了数据预处理,包括处理缺失值和去除重复值等操作;运用了特征选择方法,如卡方检验、互信息以及逐步向后特征选择法,确定关键影响因素;还使用了合成少数过采样技术(SMOTE)平衡数据集;最后利用决策树、随机森林、梯度提升、轻梯度提升(Light Gradient Boosting)、CatBoost 和 XGBClassifier 等多种机器学习算法构建预测模型,并通过多种评估指标对模型性能进行评估 。
研究结果如下:
- 模型预测性能:研究中使用的集成机器学习模型展现出了强大的预测能力。在众多模型中,轻梯度提升模型表现最为突出,其准确率达到了 95.3%,超越了其他算法。这表明该模型在预测埃塞俄比亚学龄前儿童饮食多样性水平方面具有较高的可靠性和准确性。
- 关键影响因素:通过 Eli5 和 LIME 等 XAI 工具对模型进行解释,发现儿童年龄、家庭财富指数、家庭所在地区、饮用水来源、收听广播的频率以及母亲的教育水平等,是影响埃塞俄比亚学龄前儿童最低饮食多样性(MDD)预测的关键变量。例如,Eli5 模型显示,财富指数、地区、儿童年龄等因素在预测中贡献显著;LIME 模型则进一步表明,在预测 MDD 水平时,儿童年龄、财富指数、地区等特征的重要性较高。
研究结论和讨论部分指出,这项研究成功地证明了将可解释人工智能与机器学习相结合,能够准确预测埃塞俄比亚学龄前儿童的饮食多样性。研究结果对于儿童发展和营养领域的利益相关者、政策制定者以及医学专家都具有重要意义。通过构建的可解释人工智能模型,能够为制定有针对性的干预措施和政策提供有力支持,有助于提升埃塞俄比亚学龄前儿童的营养健康水平。此外,该研究还为可解释人工智能在现实公共健康挑战中的应用开辟了新的道路,有望启发其他领域开展相关研究,推动可解释人工智能技术在更多实际问题中的应用和发展。