基于机器学习构建早、晚期结直肠癌生存预测模型及在线计算器开发

【字体: 时间:2025年04月16日 来源:Scientific Reports 3.8

编辑推荐:

  为改善结直肠癌(CRC)精准医疗,评估不同治疗方案的生存获益,研究人员开展早发性结直肠癌(EOCRC)和晚发性结直肠癌(LOCRC)患者生存预测工具的开发与验证研究。研究得出可用机器学习算法构建模型预测患者生存概率并开发在线计算器的结果,对临床决策有重要意义。

  结直肠癌(Colorectal Cancer,CRC)作为全球范围内常见的恶性肿瘤,严重威胁着人类的健康。近年来,虽然 CRC 的 5 年生存率有所提升,超过了 65%,但晚期 CRC 患者的生存率却低于 10% 。目前,肿瘤 - 淋巴结 - 转移(TNM)分期系统虽为癌症分期的标准方法,但仅包含三个变量,无法全面评估患者的预后。同时,传统的生存预测模型如列线图(nomogram)性能有限。而随着人工智能的发展,机器学习在医学领域展现出巨大潜力,不过在 CRC 患者生存预测方面,针对不同年龄分组的应用仍有待开发。
在此背景下,重庆医科大学附属大学城医院等机构的研究人员开展了相关研究,旨在利用机器学习模型开发在线计算器,预测早发性(EOCRC)和晚发性(LOCRC)结直肠癌患者 1 - 8 年的生存概率,该研究成果发表于《Scientific Reports》。

研究人员为开展此项研究,运用了多种关键技术方法。首先,从美国监测、流行病学和结果数据库(SEER)获取数据,该数据库覆盖约 28% 的美国人口,数据公开且已去标识化,使用无需伦理审批。同时,收集重庆医院(江苏省医院)的独立队列数据(CHJP 队列),并获得当地伦理委员会批准。将 SEER 数据库中的符合条件患者随机分为训练队列和内部测试队列,比例为 7:3 ,CHJP 队列作为外部测试队列。然后,对数据进行收集、整理和预处理,利用单因素和多因素回归分析筛选变量,运用合成少数过采样技术(SMOTE)处理数据不平衡问题,基于随机森林(RF)、极端梯度提升(XGB)和梯度提升(GB)算法构建机器学习模型,并通过五折交叉验证优化模型,最后用内部和外部测试队列评估模型性能。

研究结果如下:

  • 队列信息:从 SEER 数据库筛选出 117,965 例 CRC 患者,按 50 岁为界分为 EOCRC 和 LOCRC 两组,每组再随机分为训练和内部测试队列,组内各队列间变量分布无显著差异。
  • 变量与临床结局的相关性:单因素和多因素 Cox 分析显示,在 EOCRC 中,年龄增加、男性、特定婚姻状况、组织学类型等因素与更高的风险比(更差的生存)相关,而某些种族、更高收入等因素与更低的风险比(更好的生存)相关;在 LOCRC 中,也有类似趋势,且放疗和治疗延迟是影响 LOCRC 生存的独立因素。
  • 建立和评估机器学习模型:针对 EOCRC 和 LOCRC 分别开发三个机器学习模型预测 1 - 8 年生存情况。数据不平衡时用 SMOTE 技术处理,五折交叉验证优化模型。结果显示,GB 模型在内部测试队列中表现突出,EOCRC 组平均 AUC 为 0.880,LOCRC 组为 0.857 。
  • 外部独立队列评估:在 CHJP 队列中评估模型性能,EOCRC 组 XGB 模型平均 AUC 最高,为 0.804;LOCRC 组 GB 模型平均 AUC 最高,达 0.823 。
  • 变量的相对重要性:对于 EOCRC 生存预测,TNM 分期和手术是关键因素;对于 LOCRC,年龄最为重要。
  • 生存分析:基于 GB 模型计算 EOCRC 和 LOCRC 患者 5 年生存的总体风险评分,按中位数分为低风险和高风险组,结果显示低风险组预后明显更好。
  • 基于网络的应用开发:开发了用户友好的网络应用程序,通过输入患者临床特征,可预测不同治疗方案下 1 - 8 年的生存概率,并生成生存曲线和数据表格。

研究结论表明,研究人员成功开发了基于机器学习模型的在线计算器,可预测 EOCRC 和 LOCRC 患者的生存情况,且经过独立测试队列验证。该研究具有重要意义,其构建的模型在预测 CRC 患者术后生存方面优于近期研究中的列线图,并且提供了用户友好的在线计算器,增强了临床实用性。不过研究也存在一定局限性,如模型在不同人群中的准确性可能存在差异,无法直接用于治疗选择等。未来研究可通过扩大数据集、整合分子生物标志物和多中心试验等方式进一步提升模型的准确性和适用性,为结直肠癌患者的临床治疗和预后评估提供更有力的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号