基于决策树的机器学习算法精准预测急性放射性食管炎:开拓放疗新视野

【字体: 时间:2025年04月22日 来源:Biochemistry and Biophysics Reports 2.3

编辑推荐:

  在肿瘤放疗中,放射性食管炎(Radiation Esophagitis)影响患者生活质量和治疗效果。研究人员开展基于决策树模型预测急性食管炎等级的研究。结果显示该模型在二分类和多分类任务中准确率分别达 97% 和 98%。这为治疗优化和个性化风险评估提供可能。

  癌症,作为当今医学领域最难攻克的难题之一,每年在全球范围内夺走数百万人的生命。放疗作为癌症治疗的重要手段,能够精准地靶向肿瘤细胞,同时尽量避免对周围正常组织的损伤。然而,在治疗胸颈部肿瘤时,食管这个与许多肿瘤位置相近的重要器官,常常在放疗过程中受到辐射,进而引发急性放射性食管炎。这一副作用不仅让患者承受痛苦,还会严重影响他们的生活质量,甚至可能限制放疗的疗效。
以往,评估和管理放疗副作用主要依据像放射治疗肿瘤学组(Radiation Therapy Oncology Group,RTOG)分类这样的现有参考指南。但由于患者对治疗的反应各不相同,这种 “一刀切” 的方式难以满足临床需求,迫切需要更个性化的技术来预测并减少这些不良后果。尽管调强放疗(Intensity-Modulated Radiotherapy,IMRT)和质子治疗等新技术不断涌现,显著提高了放疗的精度,但急性放射性食管炎仍然是一个普遍且棘手的问题。

在这样的背景下,来自伊朗的研究人员决心攻克这一难题。他们开展了一项旨在开发并验证基于决策树模型预测急性食管炎等级的研究。该研究成果发表在《Biochemistry and Biophysics Reports》上,为放疗领域带来了新的曙光。

研究人员为开展此项研究,采用了多种关键技术方法。他们收集了来自伊朗塔比兹两家独立医院的 100 例接受胸颈部放化疗患者的数据,这些数据涵盖了 33 个特征,包括患者的人口统计学信息、临床细节以及剂量学数据等。在数据处理阶段,运用数据预处理技术,对缺失值进行插补、处理异常值,并对数值特征进行标准化;通过递归特征消除(Recursive Feature Elimination,RFE)等方法进行特征选择,确定最具预测性的特征。之后,使用决策树分类器进行二分类(Grade≥2 vs. <2)和多分类(Grades 1, 2, and 3)任务,并利用 10 折交叉验证(10-CV)和留一法交叉验证(Leave-One-Out Cross Validation,LOOCV)等技术评估模型性能。

研究结果令人瞩目:

  • 二分类性能:决策树模型在区分急性食管炎(Grade≥2 vs. <2)时,展现出了卓越的性能,准确率高达 97%。通过特征重要性分析发现,剂量学参数如 V40(接受 40Gy 辐射的体积)和平均食管剂量在分类过程中起着关键作用。同时,研究人员还提供了决策树图和混淆矩阵,清晰展示了模型的决策路径和分类效果。此外,通过实验探究树的叶子数量对模型准确率的影响,发现超过一定数量的叶子后,模型准确率不再变化。
  • 二分类规则提取与可解释性:决策树模型的一大优势就是可解释性强。从模型中提取的规则明确展示了特定特征如何影响食管炎等级的预测。例如,如果 V60≥2.3,那么预测等级为 3;如果 V60 < 2.3 且 V40≥2.105 且平均剂量≥2271.55,则预测等级为 2。这些规则与临床预期高度相符,进一步验证了模型的有效性。
  • 多分类性能:在预测食管炎具体等级(1, 2, or 3)的多分类任务中,尽管难度增加,但决策树模型依然表现出色,准确率达到 98%。研究人员通过训练不同叶子数量的决策树并进行测试,发现适当修剪树可以优化模型。同时,展示了多分类决策树结构和混淆矩阵,其中预测 Grade 3 的准确率更是达到了 100%。
  • 多分类规则提取与可解释性:通过对多分类决策树的分析,研究人员对每个特征进行了权重赋值,发现部分特征权重为零,这与树的生长约束和修剪以及特征选择有关。并且总结出可以仅用 7 个特征进行输出预测,为临床应用提供了更便捷的参考。

在结论与讨论部分,该研究成果具有重要意义。从临床角度来看,决策树模型的高准确率和可解释性使其成为临床决策支持的有力工具。它不仅能够帮助医生在放疗计划制定阶段,依据患者的具体情况更准确地预测急性放射性食管炎的发生风险,还能根据预测结果为高风险患者调整治疗方案,如优化辐射剂量、选择替代疗法或加强支持性护理等,从而有效减少副作用,提高治疗效果。与其他机器学习技术相比,决策树模型在保证准确性的同时,克服了 “黑箱” 问题,其清晰的决策规则让医生能够理解和信任模型的预测结果,更易于在临床工作中推广应用。

然而,研究也存在一些局限性。例如,样本量相对较小(n = 100),可能影响研究结果的普遍性,未来需要在更大规模、多机构的数据集上进行验证;研究中未纳入分子生物标志物(如炎症细胞因子、遗传易感性标记物),限制了模型的预测能力,后续研究可考虑整合多组学数据来完善模型;研究使用的是横断面数据,无法反映患者对放疗反应的时间变化,未来应纳入纵向数据集,开发动态预测模型。

尽管如此,这项研究依然为机器学习在放疗领域的应用奠定了坚实基础,展示了决策树模型在预测急性放射性食管炎等级方面的巨大潜力,为实现个性化放疗和提高患者生活质量开辟了新的道路。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号