通过在 PubMed/MEDLINE、EMBASE、Scopus、Web of Science、Cochrane Library 和 Google Scholar 等数据库进行文献检索,筛选出 2000 年至 2024 年 4 月期间发表的相关研究。纳入标准包括在同行评审期刊发表的原创研究、聚焦于 ML 技术在卵巢癌早期检测的应用、对卵巢癌早期进行预测、诊断或风险评估的研究、以人为研究对象、以英文撰写且报告了如准确性、敏感性、特异性等相关结果的研究。经过筛选,最终纳入 48 项研究进行综述分析。
研究结果
不同机器学习算法的性能比较:众多研究表明,多种 ML 算法在卵巢癌早期检测中展现出良好的性能。贝叶斯神经网络、定制支持向量机(SVM)和深度混合学习模型等算法取得了较高的准确率和特异性。例如,Park 等人利用 ML 模型在 30 分钟内区分不同卵巢肿瘤类型,准确率高达 97.3%;Chen 等人将拉曼光谱与 ML 模型结合,对各种卵巢癌分类的敏感性和特异性均超过 97%。此外,随机森林(RF)和极端梯度提升(XGBoost)等成熟算法在分析不同数据源时也能持续保持高准确率。不过,算法的选择需依据具体分析的数据来源,如深度学习技术中的 DenseNet 121 在分析 CT 扫描图像时表现出色,而分类与回归树(CART)在从其他数据类型中识别新型生物标志物方面效果显著。
基于机器学习技术的卵巢癌早期预测:研究探索了多种数据源用于卵巢癌的早期预测,并取得了令人瞩目的成果。Li 等人利用 DNA 甲基化谱进行早期诊断,总体准确率达到 89.5%;Yaghoobi 等人通过识别 microRNA 生物标志物,实现了 99.69% 的高诊断准确率。此外,还有研究利用代谢组学数据、磷脂生物标志物等进行建模,均展示了 ML 在分析复杂医学数据、识别早期卵巢癌微妙特征方面的强大能力。
在不同人群和人口统计学群体中的研究结果:部分研究在不同地理区域和多样化的患者群体中开展,验证了 ML 应用于不同人群的可行性。Chen 等人在中国多医院的研究以及 Gao 等人对超 10 万患者数据的分析,都获得了较高的敏感性和特异性,提示模型具有一定的通用性。然而,一些研究样本量较小,如 Salehi 等人的 15 例患者和 Acharya 等人的 20 例患者研究,限制了研究结果的普适性。因此,需要更多大规模、多样化数据集的研究,以确保 ML 模型对所有患者群体都有效。
针对特定风险群体的预测模型:为特定风险群体定制的 ML 模型能够更精准地识别高风险患者,区分早期癌症与良性疾病。Jeong 等人对比早期癌症与良性肿块,Reilly 等人评估盆腔肿块风险,Hinestrosa 等人专注于在多样化人群中早期检测,都取得了不错的敏感性结果。而且,定制模型不仅用于诊断,还能预测预后、指导治疗决策,如 Fu 等人利用模型预测卵巢癌患者的预后,Akazawa 等人开发模型区分卵巢肿块的良恶性,Wang 等人的模型有效分类卵巢组织类型,这些都凸显了定制模型的重要价值。
多种 ML 模型在卵巢癌早期诊断中表现出有效性。逻辑回归(LR)常用于二元分类,可识别高风险人群,但在处理复杂数据集时存在局限;神经网络算法(如 ANN、RNN、BPNN)、SVM、RF 和 K 近邻(KNN)等算法则展现出更高的敏感性和特异性,部分研究中其敏感性和特异性超过 96%。此外,将多种算法结合的集成方法,如 Cai 等人开发的多标准决策分类融合(MCF)框架,综合了多种 AI 模型的估计结果,在卵巢癌诊断中优于其他对比模型,提高了整体准确性和稳健性。
在应用 ML 算法时,数据质量和标准化是关键问题。模型的准确性高度依赖训练数据的质量和一致性,因此需要标准化的数据收集协议和严格的数据清洗技术,以减少诊断误差。随着 AI 在医疗领域的广泛应用,伦理和数据隐私问题也日益受到关注。在利用患者健康数据开发模型时,必须严格遵守伦理原则和隐私法规,确保数据安全。此外,ML 算法不能 “一刀切”,不同数据集训练的模型可能无法直接应用于其他人群,需要不断调整和优化模型,以适应卵巢癌的动态变化和不同人群的特点。
未来,ML 在卵巢癌检测领域具有广阔的发展前景。深入整合先进的 ML 技术和深度学习算法,有望从复杂数据集中挖掘更细微的模式。结合基因组学、转录组学和蛋白质组学等多组学数据与临床数据,能更全面地评估患者病情和风险因素。将 ML 模型转化为医护人员易于使用的工具,可加速早期检测,优化临床工作流程,提高诊断效率,改善患者预后。深度学习凭借其强大的数据处理和预测能力,将在卵巢癌诊断中发挥更重要的作用,实现更精准的诊断和更短的诊断时间。
综上所述,48 项研究充分展示了 ML 算法在卵巢癌早期检测和诊断方面的巨大潜力。众多研究取得了高诊断准确率,部分算法在多种数据类型分析中表现卓越,且 ML 在不同人群和风险群体中的应用也展现出良好前景。不过,由于部分研究样本量较小,限制了模型的普适性。未来需开展更多大规模、代表性强的研究,优化现有模型,整合多源数据,推动 ML 技术在卵巢癌早期检测中的临床应用,最终提高卵巢癌患者的生存率和生活质量。