血清微量营养素与晚期CKM综合征之间的关联:一项基于机器学习的可解释性研究

《Food Science & Nutrition》:Association Between Serum Micronutrients and Advanced CKM Syndrome: An Interpretable Machine Learning-Based Study

【字体: 时间:2025年10月25日 来源:Food Science & Nutrition 3.8

编辑推荐:

  CKM综合征是一种由心血管、肾脏和代谢疾病复杂相互作用引起的系统性病症,研究利用NHANES数据通过机器学习模型和SHAP、PDP分析,首次系统评估血清微营养素与先进CKM综合征的关联,发现β-胡萝卜素、α-生育酚、番茄红素、维生素C及25(OH)D水平降低显著增加风险(均p<0.05),其中25(OH)D是主要危险因素。LGBM模型预测性能最优(AUC=0.962),SHAP分析显示25(OH)D、番茄红素和维生素C的协同作用对风险影响最大,为精准营养干预提供新证据。

  近年来,随着科学研究的不断深入,人们越来越关注微量营养素在健康维护中的作用。CKM综合征,即心血管-肾脏-代谢综合征,是一种复杂的系统性疾病,涉及心血管系统、肾脏功能和代谢过程之间的相互作用。这种综合征被认为是多种慢性疾病的综合表现,包括心血管疾病(CVD)、慢性肾病(CKD)和代谢综合征(MetS)。目前,已有大量研究表明,饮食习惯、吸烟、饮酒等生活方式因素与肥胖、糖尿病、CKD和CVD的发生密切相关。然而,关于微量营养素与CKM综合征之间的具体关系,尤其是与“先进阶段”CKM综合征的关联,仍存在许多未解之谜。

本研究采用了一种系统的方法,结合多种传统分析模型和机器学习(ML)技术,深入探讨了血清微量营养素与先进阶段CKM综合征之间的关系。首先,我们利用美国国家健康与营养调查(NHANES)的数据,分析了六种血清微量营养素的含量,并使用Boruta算法进行特征选择。接着,我们采用七种机器学习模型来预测先进阶段CKM综合征的风险,其中包括极端梯度提升(XGBoost)、随机森林(RF)、CatBoost、Light Gradient Boosting Machine(LGBM)、决策树(DT)、K近邻(KNN)和朴素贝叶斯(NB)模型。为了增强模型的解释性,我们还应用了SHAP(Shapley Additive Explanations)和部分依赖图(PDPs)两种方法,进一步分析了血清微量营养素对先进阶段CKM综合征的影响机制。

研究结果显示,血清中β-胡萝卜素、α-生育酚、番茄红素、维生素C和25-羟基维生素D(25(OH)D)的水平降低与先进阶段CKM综合征的风险增加显著相关(所有p值均小于0.05)。其中,LGBM模型在预测先进阶段CKM综合征风险方面表现出最佳的性能,而SHAP和PDPs分析进一步揭示了25(OH)D水平的下降是主要的潜在风险因素。此外,研究还发现,25(OH)D、维生素C和番茄红素的协同作用可能在控制先进阶段CKM综合征中起到关键作用。这些发现不仅为先进阶段CKM综合征的病因提供了新的证据,也为公共卫生干预策略的制定提供了科学依据。

本研究的一个重要特点是,它首次系统地利用多种模型和机器学习方法,评估了血清微量营养素与先进阶段CKM综合征风险之间的关系。传统分析模型,如多变量逻辑回归、限制性立方样条(RCS)、加权分位数求和(WQS)回归、基于分位数的g计算(Qgcomp)回归和贝叶斯核机器回归(BKMR)模型,都被用于探索血清微量营养素对先进阶段CKM综合征的影响。这些方法分别从线性、非线性、单个影响和混合影响等不同角度分析了数据,形成了一个多维度的证据链,从而增强了研究的全面性和结论的稳健性。

研究团队还对数据进行了详细的预处理和特征选择。由于高维数据可能影响机器学习算法的性能,因此在模型构建之前,采用了Boruta算法来筛选出最具代表性的特征。此外,通过计算方差膨胀因子(VIF)评估了特征之间的多重共线性,并排除了对模型贡献较小或存在显著共线性的特征。这一过程有助于提高模型的准确性和解释性。

为了缓解样本不平衡问题,研究使用了合成少数过采样技术(SMOTE)进行数据预处理,并将处理后的数据集随机分为训练集和测试集,比例为80%和20%。在训练集上,所有模型均表现出较高的预测性能,其中LGBM模型(AUC=0.998)和KNN模型(AUC=1.000)的预测能力最强,但KNN模型在测试集上表现出一定的过拟合现象。而在测试集上,LGBM模型(AUC=0.962)表现最佳,具有良好的泛化能力。通过比较不同模型的性能指标,研究确认LGBM模型在预测先进阶段CKM综合征风险方面具有最佳表现,这为未来的研究和临床实践提供了重要的工具。

SHAP方法的应用进一步揭示了血清微量营养素在先进阶段CKM综合征风险预测中的关键作用。研究发现,25(OH)D和番茄红素是预测先进阶段CKM综合征的主要因素,且它们的水平变化对风险预测具有显著影响。此外,PDPs分析显示,在特定水平下,25(OH)D和维生素C与先进阶段CKM综合征风险呈负相关,而其他微量营养素如β-胡萝卜素和α-生育酚的影响相对较小。这些结果表明,25(OH)D、维生素C和番茄红素的协同作用可能在控制先进阶段CKM综合征中发挥重要作用,提示未来可以考虑通过优化这些营养素的摄入来降低风险。

研究还探讨了不同微量营养素之间可能存在的交互作用。通过二元PDPs分析,研究发现25(OH)D和维生素C的协同作用对先进阶段CKM综合征的风险有显著影响,当两者水平较低时,风险最高;而当至少有一个营养素水平较高时,风险则有所降低。这一发现为营养干预策略的制定提供了新的思路,即通过综合调整多种微量营养素的摄入,可以更有效地降低先进阶段CKM综合征的发生率。

从机制层面来看,研究推测,微量营养素与先进阶段CKM综合征之间的关系可能涉及氧化应激、炎症反应以及多种生理过程的调节。例如,维生素C、β-胡萝卜素、α-生育酚和番茄红素作为抗氧化剂,能够中和细胞内的自由基,减少氧化损伤和炎症反应。这些营养素的缺乏可能导致氧化应激水平升高,从而促进炎症的发生,进而影响心血管系统、肾脏功能和代谢状态。此外,25(OH)D的缺乏可能通过影响内皮功能、调节血管紧张素系统和减少抗炎作用,进一步加剧先进阶段CKM综合征的发展。

尽管本研究提供了有力的证据支持血清微量营养素与先进阶段CKM综合征之间的关联,但仍存在一些局限性。首先,本研究使用的数据为横断面数据,无法明确因果关系。因此,未来的研究应考虑纵向数据,以更准确地评估微量营养素对疾病发展的影响。其次,研究中未考虑CKM综合征与微量营养素水平之间的潜在反向因果关系,例如,先进阶段CKM综合征可能导致营养吸收障碍,从而影响微量营养素的水平。此外,本研究模型的外部验证尚不充分,未来需要在更大规模的公开或私人数据库中进行多中心验证,以提高模型的普适性和可推广性。最后,研究仅基于美国非机构化人口的样本数据,缺乏其他地区或国家的代表性数据,因此研究结果的外推能力仍需进一步验证。

总体而言,本研究通过整合多种传统分析模型和机器学习方法,系统地评估了血清微量营养素与先进阶段CKM综合征之间的关系,揭示了其中的关键风险因素,并提出了基于营养素组合的干预策略。这些发现不仅有助于深化对CKM综合征发病机制的理解,也为公共卫生政策的制定和个体化医疗实践提供了重要的参考依据。未来的研究应进一步探索微量营养素的摄入量与疾病进展之间的具体关系,并结合更全面的临床和生活方式数据,以构建更加精准的预测模型和干预方案。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号