希腊圣卢克诊所(St Luke’s Clinic)的 Elena Fountzilas 等研究人员在npj Digital Medicine期刊上发表了题为 “Convergence of evolving artificial intelligence and machine learning techniques in precision oncology” 的论文。该论文聚焦于人工智能(AI)和机器学习(ML)技术在精准肿瘤学领域的应用,对于推动肿瘤诊断和治疗策略的进步、改善癌症患者的临床结局具有重要意义。这一研究紧跟科技发展趋势,为解决肿瘤学领域的难题提供了新的思路和方法,有望在未来改变肿瘤治疗的格局。
一、研究背景
随着科技的飞速发展,AI 和 ML 技术逐渐渗透到各个领域,精准肿瘤学也迎来了新的发展契机。精准肿瘤学旨在利用患者的基因、蛋白质和环境信息进行疾病诊断和治疗,而 AI 和 ML 技术能够分析多维、多组学、空间病理学和放射组学数据,助力深入理解肿瘤复杂的分子通路,优化治疗方案的选择。
AI 通过对大量代表性示例(训练数据)的学习,具备识别模式和关系并进行准确预测的能力。早期的 “符号化” 或 “基于规则” 的 AI 系统在处理复杂任务时存在局限性,如 IBM Watson for Oncology 在肿瘤临床决策中与专家临床医生的治疗建议一致性不高。ML 则强调计算机系统通过发现数据中的模式并迭代改进预测性能,可分为有监督学习和无监督学习。深度学习(DL)作为 ML 的子集,聚焦于人工神经网络,在计算机视觉、自然语言处理等领域成果显著,也为肿瘤学研究带来了新的方法。基础模型或大型语言模型(LLMs)如 GPTs 的出现,进一步拓展了 AI 在肿瘤学中的应用潜力,其能够处理多种类型的数据,实现多模态分析,在肿瘤诊断、治疗决策等方面具有广阔的应用前景。
与此同时,肿瘤学领域出现了许多新的疾病深度测量方法,如病理切片的多重数字空间分析、医学图像的定量数字分析、基因组测序和生物分子的质谱分析等。这些技术产生的高维、多模态数据为肿瘤学研究提供了丰富信息,但也带来了分析上的挑战。在这种背景下,将 AI 和 ML 技术应用于精准肿瘤学,不仅有助于应对数据挑战,还能为肿瘤的诊断、治疗和管理提供更精准、有效的手段,因此具有重要的研究价值和临床意义。
放射组学在预测免疫治疗结果等方面的应用:研究人员运用统计和 ML 方法,结合基线 CT 成像和 H&E 染色 WSIs 的 AI 分析,开发了多种预测模型。例如,通过构建放射组学模型预测非小细胞肺癌(NSCLC)患者的 TIL 密度,发现高预测 TIL 密度与更长的无进展生存期(PFS)相关。放射组学还被用于预测免疫治疗的疗效、总生存期(OS)和肿瘤突变负荷(TMB)等。部分研究表明,基于 AI/ML 的放射组学分析在癌症诊断和分期方面的性能优于医生,且结合多模态数据的模型能进一步提高预测准确性,但这些结果仍需在更大的患者队列中进行验证。
3.1.3 分子医学
基因组分析中的挑战与 AI/ML 的应用:在利用下一代测序(NGS)技术进行基因组分析时,分子改变注释和变异检测存在误差,传统的基于 ML 模型的变异检测工具准确性欠佳。而 CNNs 在变异检测中的应用取得了突破,如 DeepVariant 在 FDA 管理的变异检测挑战中表现优异,在短读长和长读长测序技术上均能良好运行,且具有较好的通用性。
模型透明度和信任:AI 算法的复杂性使得模型缺乏透明度,医疗专业人员对其可靠性存在疑虑。可解释 AI(XAI)方法对于建立对 AI 建议的信任至关重要,有助于提高模型的透明度和可信度。
准确性和可靠性:临床决策支持系统中的 AI 预测存在不准确和不可靠的问题,在部署前需要进行严格的临床验证、标准化和真实世界测试,并持续监测模型性能。
问责制:随着 AI 系统融入医疗保健,需要明确 AI 开发者、医疗服务提供者和机构的责任,建立有效的上市后监测机制,确保 AI 系统符合伦理和临床标准。
数据隐私和伦理使用:AI 系统需要大量患者数据,引发了数据隐私和伦理问题,如数据的收集、存储和共享需遵循相关法规,保障患者权利。同时,各利益相关者需加强合作,推动 AI 在医疗保健领域的伦理和有效整合。
3.4 数据隐私与机构间合作
AI 在肿瘤学中的发展依赖大量多样的数据,但跨机构共享敏感患者数据面临隐私、监管和伦理挑战。联邦学习(FL)技术的出现为解决这些问题提供了方案,它允许在不共享原始患者数据的情况下进行多机构协作,通过在各机构本地训练模型并共享模型参数,既保护了患者隐私,又促进了数据的有效利用。现代平台采用标准化的临床数据协调管道,确保 FL 符合隐私法规,推动了多机构间的合作,为 AI 在肿瘤学领域的发展提供了更广阔的空间。
可解释 AI 的发展:简单 AI 模型透明度高但准确性低,复杂模型(如 CNNs)准确性高但缺乏可解释性。XAI 旨在提高 AI 预测的透明度、可解释性和可信度,有助于揭示潜在偏差,增强模型的可信度,促进其在临床决策中的应用。
四、研究结论和讨论
AI/ML 技术在精准肿瘤学领域展现出巨大的潜力,通过分析多维数据,有助于深入理解肿瘤生物学,优化治疗选择。然而,目前该技术在实际应用中仍面临诸多挑战,如数据质量和数量问题、与现有临床工作流程的整合困难、成本较高以及专业人员对新技术的适应问题等。尽管已有许多关于 AI/ML 技术的研究发表,但由于这些挑战的存在,在肿瘤学中进行前瞻性使用该技术的临床试验较少。目前,AI/ML 技术主要应用于图像分析以识别相关特征和生物标志物,若要将 AI 作为智能 “助手” 应用于临床,还需开发相关基准以确保其在真实世界中的性能。
为推动 AI/ML 技术在精准肿瘤学中的应用,需要采取一系列措施。例如,遵循 “FAIR” 数据原则,提高数据的质量和可及性;加强各利益相关者的合作,将 AI 纳入常规保险覆盖范围,开展临床医生培训,持续评估 AI 应用的可行性和有效性;开展患者教育,提高患者对 AI 工具的信任度等。未来,AI 的进一步发展可能包括将符号化和 DL 模型相结合的神经符号 AI,融合两者优势,形成更具可解释性和高性能的技术。