编辑推荐:
胰腺癌死亡率高、早期诊断困难。研究人员开展基于机器学习(ML)算法和可解释人工智能(XAI)的胰腺癌诊断研究。结果显示,集成投票分类器和混合模型性能优异,SHAP 分析明确关键特征。该研究为胰腺癌诊断提供新策略,助力精准医疗。
在医学飞速发展的今天,癌症却依旧是人类健康的巨大威胁,尤其是胰腺癌,堪称 “癌中之王”。每年全球有超 40 万人因胰腺癌离世,其 5 年生存率低于 10%,预计到 2030 年将成为癌症死亡的首要原因。由于胰腺癌早期症状不典型,容易与其他疾病混淆,加上缺乏有效的早期筛查技术,多数患者确诊时已处于晚期,错过了最佳治疗时机。传统的诊断方法,如内镜超声(EUS)、正电子发射断层扫描(PET)、计算机断层扫描(CT)和磁共振成像(MRI)等,不仅成本高昂,而且敏感性和特异性有限,难以在无症状人群中早期检测出胰腺癌。因此,寻找一种高效、准确的胰腺癌早期诊断方法迫在眉睫。
在此背景下,来自沙特阿拉伯国王沙特大学信息系统系、土耳其近东大学等机构的研究人员开展了一项极具意义的研究。他们将多种机器学习(ML)算法与可解释人工智能(XAI)相结合,致力于实现胰腺癌的早期精准诊断。该研究成果发表在《Scientific Reports》上,为胰腺癌的诊断开辟了新的道路。
研究人员主要运用了以下关键技术方法:首先,选用来自 Kaggle 的包含 590 个患者尿液样本的数据集,该数据集涵盖多种临床特征。接着,运用数据预处理技术,处理数据缺失和不平衡问题,并进行标签编码。然后,采用逻辑回归(LR)、K 近邻(KNN)、随机森林(RF)、支持向量机(SVM)、朴素贝叶斯(NB)、决策树(DT)和投票分类器等多种 ML 算法构建模型,并利用 GridSearchCV 进行超参数调优。最后,使用 Shapley 加性解释(SHAP)方法解释模型结果 。
研究结果
- 相关性分析:通过对不同属性的相关性分析发现,LYVE1 与胰腺癌诊断结果呈高度正相关,年龄、性别、血浆 CA19 - 9、肌酐、LYVE1、REG1B、TFF1 和 REG1A 等也是胰腺癌诊断的重要预测指标,而分期、良性样本诊断特征与诊断呈负相关。
- 模型性能评估:在对所有训练的传统分类器进行评估时,RF 和 NB 模型表现出色,准确率均达到 94.07%,高于其他模型。在召回率、F1 分数和 AUC - ROC 指标上,RF 表现突出;而在精度方面,NB 优于 RF。
- 集成模型性能:基于 RF 和 NB 构建的集成投票分类器表现更为优异,准确率达到 96.61%,超过了所有单一模型。其精度、召回率、F1 分数和 AUC - ROC 值分别为 98.72%、96.25%、97.47% 和 98.98% ,在检测癌症和非癌症病例方面具有高度的特异性和敏感性。
- 混合模型性能:将集成分类器与单个传统分类器构建的 6 种混合模型,性能均优于单一模型。其中,投票分类器 - RF、投票分类器 - NB 和投票分类器 - SVM 模型的准确率较高。投票分类器 - RF 混合模型的 AUC 达到 99.05% ,展现出强大的诊断能力。
- 模型可解释性:利用 SHAP 分析发现,良性样本诊断、TFF1 和 LYVE1 是影响胰腺癌诊断的前三大关键特征,其 SHAP 值越高,对早期胰腺癌诊断的影响越大。不过,SHAP 在分析复杂模型时存在计算困难,在癌症等严重健康状况下实时部署面临挑战。
研究结论与讨论
该研究成功运用 ML 算法和 XAI 技术,实现了基于尿液检测结果的胰腺癌精准分类。集成投票分类器和混合模型的出色表现,为胰腺癌的早期诊断提供了新的有效工具。SHAP 分析明确了关键影响特征,有助于临床医生更好地理解模型决策过程,提高诊断的准确性和可靠性。
然而,研究也存在一定的局限性。例如,混合模型的构建需要大量的计算资源和时间,在资源有限的临床环境中实时部署困难。此外,数据偏差、数据质量以及模型对特定数据集的依赖等问题,也可能影响模型的泛化能力和准确性。未来研究需要收集更广泛、多样化的数据,运用更先进的数据处理技术,以提高模型的稳健性和适用性。
尽管如此,这项研究依然意义重大。它为胰腺癌的早期诊断提供了创新思路和方法,有望在临床实践中广泛应用,提高胰腺癌患者的早期诊断率,改善患者预后。同时,该研究也为其他癌症及疾病的诊断研究提供了有益参考,推动了生命科学和健康医学领域的发展。相信在未来,随着技术的不断进步和研究的深入,胰腺癌等重大疾病的诊断和治疗将取得更大的突破,为人类健康带来更多希望。