综述:机器学习在卵巢癌早期检测中的应用

【字体: 时间:2025年03月15日 来源:Discover Medicine

编辑推荐:

  本文综述了机器学习(ML)算法在卵巢癌早期检测中的应用,展现其潜力与挑战。

  # 机器学习在卵巢癌早期检测中的研究进展
卵巢癌严重威胁女性健康,是导致女性癌症相关死亡的重要原因之一。由于早期症状不明显,缺乏有效的筛查手段,多数患者确诊时已处于晚期,五年生存率较低。早期发现卵巢癌对改善患者预后至关重要,而机器学习(ML)技术的发展为卵巢癌早期检测带来了新的希望。

卵巢癌早期检测的现状与挑战


卵巢癌早期常表现出腹胀、盆腔疼痛和疲劳等模糊或非特异性症状,这些症状易被忽视或误诊为其他良性疾病,从而延误诊断。目前,临床上常用的检测方法,如经阴道超声(TVUS)和 CA-125 检测,都存在一定的局限性。TVUS 虽然能观察卵巢的形态,但在敏感性和特异性方面存在不足,可能遗漏早期癌症或误判良性囊肿为恶性;CA-125 检测虽能测量与卵巢癌相关的蛋白质抗原,但在一些良性疾病中,其水平也会升高,因此不能作为单独有效的筛查工具。

机器学习在卵巢癌早期检测中的应用


研究方法


通过在 PubMed/MEDLINE、EMBASE、Scopus、Web of Science、Cochrane Library 和 Google Scholar 等数据库进行文献检索,筛选出 2000 年至 2024 年 4 月期间发表的相关研究。纳入标准包括在同行评审期刊发表的原创研究、聚焦于 ML 技术在卵巢癌早期检测的应用、对卵巢癌早期进行预测、诊断或风险评估的研究、以人为研究对象、以英文撰写且报告了如准确性、敏感性、特异性等相关结果的研究。经过筛选,最终纳入 48 项研究进行综述分析。

研究结果


  1. 不同机器学习算法的性能比较:众多研究表明,多种 ML 算法在卵巢癌早期检测中展现出良好的性能。贝叶斯神经网络、定制支持向量机(SVM)和深度混合学习模型等算法取得了较高的准确率和特异性。例如,Park 等人利用 ML 模型在 30 分钟内区分不同卵巢肿瘤类型,准确率高达 97.3%;Chen 等人将拉曼光谱与 ML 模型结合,对各种卵巢癌分类的敏感性和特异性均超过 97%。此外,随机森林(RF)和极端梯度提升(XGBoost)等成熟算法在分析不同数据源时也能持续保持高准确率。不过,算法的选择需依据具体分析的数据来源,如深度学习技术中的 DenseNet 121 在分析 CT 扫描图像时表现出色,而分类与回归树(CART)在从其他数据类型中识别新型生物标志物方面效果显著。
  2. 基于机器学习技术的卵巢癌早期预测:研究探索了多种数据源用于卵巢癌的早期预测,并取得了令人瞩目的成果。Li 等人利用 DNA 甲基化谱进行早期诊断,总体准确率达到 89.5%;Yaghoobi 等人通过识别 microRNA 生物标志物,实现了 99.69% 的高诊断准确率。此外,还有研究利用代谢组学数据、磷脂生物标志物等进行建模,均展示了 ML 在分析复杂医学数据、识别早期卵巢癌微妙特征方面的强大能力。
  3. 在不同人群和人口统计学群体中的研究结果:部分研究在不同地理区域和多样化的患者群体中开展,验证了 ML 应用于不同人群的可行性。Chen 等人在中国多医院的研究以及 Gao 等人对超 10 万患者数据的分析,都获得了较高的敏感性和特异性,提示模型具有一定的通用性。然而,一些研究样本量较小,如 Salehi 等人的 15 例患者和 Acharya 等人的 20 例患者研究,限制了研究结果的普适性。因此,需要更多大规模、多样化数据集的研究,以确保 ML 模型对所有患者群体都有效。
  4. 针对特定风险群体的预测模型:为特定风险群体定制的 ML 模型能够更精准地识别高风险患者,区分早期癌症与良性疾病。Jeong 等人对比早期癌症与良性肿块,Reilly 等人评估盆腔肿块风险,Hinestrosa 等人专注于在多样化人群中早期检测,都取得了不错的敏感性结果。而且,定制模型不仅用于诊断,还能预测预后、指导治疗决策,如 Fu 等人利用模型预测卵巢癌患者的预后,Akazawa 等人开发模型区分卵巢肿块的良恶性,Wang 等人的模型有效分类卵巢组织类型,这些都凸显了定制模型的重要价值。

讨论


机器学习模型在卵巢癌早期检测中的优势


多种 ML 模型在卵巢癌早期诊断中表现出有效性。逻辑回归(LR)常用于二元分类,可识别高风险人群,但在处理复杂数据集时存在局限;神经网络算法(如 ANN、RNN、BPNN)、SVM、RF 和 K 近邻(KNN)等算法则展现出更高的敏感性和特异性,部分研究中其敏感性和特异性超过 96%。此外,将多种算法结合的集成方法,如 Cai 等人开发的多标准决策分类融合(MCF)框架,综合了多种 AI 模型的估计结果,在卵巢癌诊断中优于其他对比模型,提高了整体准确性和稳健性。

早期检测卵巢癌对降低疾病死亡率至关重要,因为晚期卵巢癌治疗效果不佳,而早期发现可显著提高生存率。ML 模型能够分析血液检测、超声扫描和患者病史等多源数据,在症状出现前识别高危个体,为早期治疗提供可能。一些模型还能快速完成诊断,如利用 SNTN 和 AOX1 表达,可在 30 分钟内完成病例诊断。

面临的挑战与未来展望


在应用 ML 算法时,数据质量和标准化是关键问题。模型的准确性高度依赖训练数据的质量和一致性,因此需要标准化的数据收集协议和严格的数据清洗技术,以减少诊断误差。随着 AI 在医疗领域的广泛应用,伦理和数据隐私问题也日益受到关注。在利用患者健康数据开发模型时,必须严格遵守伦理原则和隐私法规,确保数据安全。此外,ML 算法不能 “一刀切”,不同数据集训练的模型可能无法直接应用于其他人群,需要不断调整和优化模型,以适应卵巢癌的动态变化和不同人群的特点。

未来,ML 在卵巢癌检测领域具有广阔的发展前景。深入整合先进的 ML 技术和深度学习算法,有望从复杂数据集中挖掘更细微的模式。结合基因组学、转录组学和蛋白质组学等多组学数据与临床数据,能更全面地评估患者病情和风险因素。将 ML 模型转化为医护人员易于使用的工具,可加速早期检测,优化临床工作流程,提高诊断效率,改善患者预后。深度学习凭借其强大的数据处理和预测能力,将在卵巢癌诊断中发挥更重要的作用,实现更精准的诊断和更短的诊断时间。

研究局限性


本综述主要聚焦于英文文献,可能存在发表偏倚。尽管如此,该综述为未来研究提供了诸多方向,后续需要更多研究来完善和拓展这些新发现。

综上所述,48 项研究充分展示了 ML 算法在卵巢癌早期检测和诊断方面的巨大潜力。众多研究取得了高诊断准确率,部分算法在多种数据类型分析中表现卓越,且 ML 在不同人群和风险群体中的应用也展现出良好前景。不过,由于部分研究样本量较小,限制了模型的普适性。未来需开展更多大规模、代表性强的研究,优化现有模型,整合多源数据,推动 ML 技术在卵巢癌早期检测中的临床应用,最终提高卵巢癌患者的生存率和生活质量。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
    生物通微信公众号
    微信
    新浪微博

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号

    生物通精彩推荐 • 基因编辑PRPF31+/− hiPSC-RPE细胞外囊泡RNA含量揭示视网膜变性的新型生物标志物潜力 • 生物可降解直肠周围间隔物在局限性前列腺癌放射治疗中减轻治疗毒性的研究:系统综述与荟萃分析