机器学习助力揭秘:高尿酸血症患者肾功能损伤的关键预测因素

【字体: 时间:2025年03月16日 来源:Scientific Reports 3.8

编辑推荐:

  为探究高尿酸血症患者肾功能损伤风险因素,研究人员构建机器学习模型,发现年龄、Cys-C、UA 和性别是关键预测指标,对临床防治意义重大。

  在健康的 “版图” 中,肾脏就像一座精密的 “过滤工厂”,勤勤恳恳地为身体净化血液、排出废物。然而,高尿酸血症这位不速之客,却悄然威胁着这座 “工厂” 的正常运转。近年来,我国高尿酸血症患病率逐年攀升,可令人困惑的是,并非所有高尿酸血症患者都会出现肾功能损伤,尿酸(UA)在其中的复杂作用难以解释。而且,目前对于高尿酸血症与肾功能损伤之间关系的研究,要么包含标准 UA 水平人群,未聚焦特定高尿酸血症群体;要么在研究过程中存在各种局限性,导致结论存在争议。为了打破这一僵局,来自南京中医药大学附属医院等机构的研究人员展开了深入研究,其成果发表在《Scientific Reports》上,为临床防治提供了新的方向。
研究人员主要采用了多种机器学习算法和统计分析方法。他们从南京中医药大学附属医院大数据平台收集了 2019 年 6 月至 2022 年 6 月期间 3410 例高尿酸血症患者的数据,经过严格的纳入和排除标准筛选,最终确定 2705 例患者纳入研究,其中 1577 例有肾功能损伤,828 例无肾功能损伤。通过 R 语言进行数据分析,利用 Mice 包处理缺失值,将数据集按 7:3 的比例随机分为训练集和验证集。运用随机森林、LASSO 回归、XGBoost 这三种机器学习算法进行特征选择,构建逻辑回归模型并评估其性能,使用受限立方样条(RCS)曲线分析剂量 - 反应关系。

研究结果


  1. 基线特征:对缺失值进行多重插补后,插补数据集与原始数据集无显著差异。训练集和验证集中,空腹血糖(FBG)、天冬氨酸转氨酶(AST)和视黄醇结合蛋白(RBP)水平在有肾功能损伤和无肾功能损伤患者之间无显著差异,其他特征变量组间差异显著1
  2. 特征选择:通过随机森林、LASSO 回归和 XGBoost 三种模型进行特征选择,再经维恩图分析,确定年龄、胱抑素 C(Cys-C)、UA 和性别为四个关键预测变量。这意味着这四个因素在预测高尿酸血症患者肾功能损伤方面具有重要价值2
  3. 模型构建与性能评估
    • 判别分析:构建的逻辑回归模型无明显共线性,在训练集和验证集中,受试者工作特征曲线下面积(AUC)分别为 0.818 [95% CI(0.796 - 0.817)] 和 0.820 [95% CI(0.787 - 0.853)],表明模型判别能力良好34
    • 校准分析:训练集和验证集的校准曲线 Brier 评分分别为 0.160 [95% CI(0.150 - 0.170)] 和 0.158 [95% CI(0.142 - 0.172)],模型通过校准度校准和一致性检验,说明模型预测结果与实际情况较为吻合5
    • 临床效用评估与风险因素分析:决策曲线分析(DCA)显示,训练集和验证集的阈值概率范围分别为 6 - 99.02% 和 7 - 93.14%,具有较强的临床决策能力。进一步分析发现,Cys-C 每升高 0.5mg/L,风险增加 13%;年龄每增加 10 年,风险增加 81%;UA 每升高 100μmol/L,风险增加 73%67

  4. 敏感性分析:对原始数据有缺失值和无缺失值的病例进行分组,比较原始数据集、插补数据集和无缺失值数据集,发现除白细胞(WBC)、甘油三酯 - 葡萄糖指数(TyG)和总胆红素(TBIL)外,其他特征变量组间无显著差异。在三组数据上建立模型,似然比检验表明模型建立和区分无显著差异,说明研究结果具有一定的稳健性89
  5. 剂量 - 反应分析:RCS 分析显示,年龄和 Cys-C 与肾功能损伤风险呈非线性关系,年龄在 40 岁存在拐点,40 岁以下患者风险增加更明显;Cys-C 在 1.33mg/L 存在阈值效应,低于该阈值风险增加幅度更大。而 UA 与肾功能损伤风险呈线性关系,UA 水平越高,肾脏损伤可能性越大10

研究结论与意义


本研究通过机器学习方法,明确了年龄、Cys-C、UA 和性别是高尿酸血症患者肾功能损伤的关键预测因素。这一成果具有重要的临床意义,临床管理可聚焦于控制 Cys-C 和 UA 水平,从而降低肾功能损伤风险。考虑到性别差异,临床治疗应采取性别特异性的治疗方法。同时,Cys-C 和年龄对肾功能的阈值效应,为临床决策提供了重要参考。不过,该研究也存在一定局限性,如模型预测准确性有待提高,可通过纳入更多生物标志物、采用更复杂的深度学习架构等方式改进;研究数据来自单中心,模型在不同种族和地区的普适性需进一步验证等。但这并不影响其为后续研究和临床实践开辟新的道路,相信随着研究的不断深入,高尿酸血症相关肾功能损伤的防治将取得更大进展。<【机器学习助力揭秘:高尿酸血症患者肾功能损伤的关键预测因素】【为探究高尿酸血症患者肾功能损伤风险因素,研究人员构建机器学习模型,发现年龄、Cys-C、UA 和性别是关键预测指标,对临床防治意义重大。】【高尿酸血症 | 肾功能损伤 | 机器学习 | 随机森林 | LASSO 回归 | XGBoost|ROC 曲线 | Cys-C|UA | 风险因素】【国内】【在健康的 “版图” 中,肾脏就像一座精密的 “过滤工厂”,勤勤恳恳地为身体净化血液、排出废物。然而,高尿酸血症这位不速之客,却悄然威胁着这座 “工厂” 的正常运转。近年来,我国高尿酸血症患病率逐年攀升,可令人困惑的是,并非所有高尿酸血症患者都会出现肾功能损伤,尿酸(UA)在其中的复杂作用难以解释。而且,目前对于高尿酸血症与肾功能损伤之间关系的研究,要么包含标准 UA 水平人群,未聚焦特定高尿酸血症群体;要么在研究过程中存在各种局限性,导致结论存在争议。为了打破这一僵局,来自南京中医药大学附属医院等机构的研究人员展开了深入研究,其成果发表在《Scientific Reports》上,为临床防治提供了新的方向。

研究人员主要采用了多种机器学习算法和统计分析方法。他们从南京中医药大学附属医院大数据平台收集了 2019 年 6 月至 2022 年 6 月期间 3410 例高尿酸血症患者的数据,经过严格的纳入和排除标准筛选,最终确定 2705 例患者纳入研究,其中 1577 例有肾功能损伤,828 例无肾功能损伤。通过 R 语言进行数据分析,利用 Mice 包处理缺失值,将数据集按 7:3 的比例随机分为训练集和验证集。运用随机森林、LASSO 回归、XGBoost 这三种机器学习算法进行特征选择,构建逻辑回归模型并评估其性能,使用受限立方样条(RCS)曲线分析剂量 - 反应关系。

研究结果


  1. 基线特征:对缺失值进行多重插补后,插补数据集与原始数据集无显著差异。训练集和验证集中,空腹血糖(FBG)、天冬氨酸转氨酶(AST)和视黄醇结合蛋白(RBP)水平在有肾功能损伤和无肾功能损伤患者之间无显著差异,其他特征变量组间差异显著。
  2. 特征选择:通过随机森林、LASSO 回归和 XGBoost 三种模型进行特征选择,再经维恩图分析,确定年龄、胱抑素 C(Cys-C)、UA 和性别为四个关键预测变量。这意味着这四个因素在预测高尿酸血症患者肾功能损伤方面具有重要价值。
  3. 模型构建与性能评估
    • 判别分析:构建的逻辑回归模型无明显共线性,在训练集和验证集中,受试者工作特征曲线下面积(AUC)分别为 0.818 [95% CI(0.796 - 0.817)] 和 0.820 [95% CI(0.787 - 0.853)],表明模型判别能力良好。
    • 校准分析:训练集和验证集的校准曲线 Brier 评分分别为 0.160 [95% CI(0.150 - 0.170)] 和 0.158 [95% CI(0.142 - 0.172)],模型通过校准度校准和一致性检验,说明模型预测结果与实际情况较为吻合。
    • 临床效用评估与风险因素分析:决策曲线分析(DCA)显示,训练集和验证集的阈值概率范围分别为 6 - 99.02% 和 7 - 93.14%,具有较强的临床决策能力。进一步分析发现,Cys-C 每升高 0.5mg/L,风险增加 13%;年龄每增加 10 年,风险增加 81%;UA 每升高 100μmol/L,风险增加 73%。

  4. 敏感性分析:对原始数据有缺失值和无缺失值的病例进行分组,比较原始数据集、插补数据集和无缺失值数据集,发现除白细胞(WBC)、甘油三酯 - 葡萄糖指数(TyG)和总胆红素(TBIL)外,其他特征变量组间无显著差异。在三组数据上建立模型,似然比检验表明模型建立和区分无显著差异,说明研究结果具有一定的稳健性。
  5. 剂量 - 反应分析:RCS 分析显示,年龄和 Cys-C 与肾功能损伤风险呈非线性关系,年龄在 40 岁存在拐点,40 岁以下患者风险增加更明显;Cys-C 在 1.33mg/L 存在阈值效应,低于该阈值风险增加幅度更大。而 UA 与肾功能损伤风险呈线性关系,UA 水平越高,肾脏损伤可能性越大。

研究结论与意义


本研究通过机器学习方法,明确了年龄、Cys-C、UA 和性别是高尿酸血症患者肾功能损伤的关键预测因素。这一成果具有重要的临床意义,临床管理可聚焦于控制 Cys-C 和 UA 水平,从而降低肾功能损伤风险。考虑到性别差异,临床治疗应采取性别特异性的治疗方法。同时,Cys-C 和年龄对肾功能的阈值效应,为临床决策提供了重要参考。不过,该研究也存在一定局限性,如模型预测准确性有待提高,可通过纳入更多生物标志物、采用更复杂的深度学习架构等方式改进;研究数据来自单中心,模型在不同种族和地区的普适性需进一步验证等。但这并不影响其为后续研究和临床实践开辟新的道路,相信随着研究的不断深入,高尿酸血症相关肾功能损伤的防治将取得更大进展。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号