-
生物通官微
陪你抓住生命科技
跳动的脉搏
哈佛通用癌症评估AI模型:可以诊断癌症、指导治疗、预测患者生存 近94%的准确率!可进行广泛的癌症评估任务
【字体: 大 中 小 】 时间:2024年10月14日 来源:哈佛大学
编辑推荐:
今年诺贝尔物理奖花落人工智能先驱,化学奖一半授予了设计能预测蛋白质结构的AI模型AlphaFold2的科学家。照这趋势,能诊断疾病、指导治疗、预测生存的AI模型将来有望拿下生理医学奖...就看哪个模型更厉害了。
哈佛医学院(Harvard Medical School)的科学家设计了一种多功能的、类似ChatGPT的人工智能模型,能够对多种癌症进行一系列诊断。周三在《Nature》杂志上描述的这种新的人工智能系统,比目前许多用于癌症诊断的人工智能方法更进了一步。目前的人工智能系统通常被训练来执行特定的任务,比如检测癌症的存在或预测肿瘤的基因特征,而且它们往往只适用于少数几种癌症类型。相比之下,新模型可以执行广泛的任务,并在19种癌症类型上进行了测试,使其具有像ChatGPT这样的大型语言模型那样的灵活性。虽然最近出现了其他基于病理图像进行医学诊断的基础人工智能模型,但据信这是第一个预测患者结果并在几个国际患者群体中进行验证的模型。
“我们的目标是创建一个灵活、多功能的类似ChatGPT的人工智能平台,可以执行广泛的癌症评估任务,”该研究的资深作者、哈佛医学院布拉瓦尼克研究所生物医学信息学助理教Kun-Hsing Yu表示:“我们的模型在与多种癌症的癌症检测、预后和治疗反应相关的多项任务中非常有用。”
该团队的最新工作建立在Yu之前对结肠癌和脑肿瘤评估的数字病理人工智能系统的研究基础上。这些早期的研究证明了这种方法在特定癌症类型和特定任务中的可行性。这个名为CHIEF(临床组织病理学成像评估基金会)的新模型是在1500万张未标记的图像上进行训练的,这些图像被分成感兴趣的部分。然后,对该工具进行进一步的训练,对60,000张组织的整张幻灯片图像进行训练,包括肺、乳腺、前列腺、结肠直肠、胃、食管、肾、脑、肝、甲状腺、胰腺、宫颈、子宫、卵巢、睾丸、皮肤、软组织、肾上腺和膀胱。训练模型同时查看图像的特定部分和整个图像,使其能够将一个区域的特定变化与整体背景联系起来。研究人员说,这种方法使CHIEF能够通过考虑更广泛的背景来更全面地解读图像,而不是仅仅关注某个特定区域。
在培训之后,该团队在来自全球24家医院和患者队列的32个独立数据集的19400多张整张幻灯片图像上测试了CHIEF的性能。在包含11种癌症类型的15个数据集上,CHIEF在癌症检测方面实现了近94%的准确率,显著优于当前的人工智能方法。
该人工智能模型通过读取肿瘤组织的数字幻灯片来工作,检测癌细胞,并根据图像上看到的细胞特征预测肿瘤的分子特征,其准确性优于目前大多数人工智能系统。它可以预测多种癌症类型患者的生存,并准确定位肿瘤周围组织(也称为肿瘤微环境)的特征,这些特征与患者对标准治疗(包括手术、化疗、放疗和免疫治疗)的反应有关。最后,该团队表示,该工具似乎能够产生新的见解-它识别出以前不知道与患者生存相关的特定肿瘤特征。研究小组表示,这些发现进一步证明,人工智能驱动的方法可以提高临床医生有效、准确评估癌症的能力,包括识别可能对标准癌症治疗反应不佳的患者。Yu说:“如果进一步验证并广泛应用,我们的方法以及类似于我们的方法,可以识别早期癌症患者,这些患者可能受益于针对某些分子变异的实验性治疗,这种能力在世界各地并不统一。”
总体而言,CHIEF在癌细胞检测、肿瘤起源识别、预测患者预后、以及识别与治疗反应相关的基因和DNA模式的存在等方面表现出色,比其他最先进的人工智能方法高出36%。由于其多功能训练,无论对哪种方法获得的肿瘤细胞——活检或者是手术切除来源的,CHIEF都表现同样良好。不管使用何种技术对癌细胞样本进行数字化处理,结果都一样准确。研究人员说,这种适应性使得CHIEF可以在不同的临床环境中使用,并且代表了当前模型的重要一步,这些模型往往只有在通过特定技术读取组织时才能表现良好。
在包含11种癌症类型的15个数据集上,CHIEF在癌症检测方面实现了近94%的准确率,显著优于当前的人工智能方法。在从独立队列收集的5个活检数据集中,CHIEF在包括食道癌、胃癌、结肠癌和前列腺癌在内的多种癌症类型中达到了96%的准确率。当研究人员在以前从未见过的结肠、肺、乳腺、子宫内膜和子宫颈手术切除肿瘤的切片上测试CHIEF时,该模型的准确率超过90%。
肿瘤的基因构成是决定其未来行为和最佳治疗方法的关键线索。为了获得这些信息,肿瘤学家要求对肿瘤样本进行DNA测序,但由于将样本送到专门的DNA测序实验室所涉及的成本和时间,这种详细的癌症组织基因组图谱并没有在世界范围内常规或统一地完成。即使在资源丰富的地区,这一过程也可能需要数周时间。他说,人工智能可以填补这一空白。
研究人员说,在暗示特定基因组畸变的图像上快速识别细胞模式,可以提供一种快速而经济的替代基因组测序的方法。在通过观察显微镜载玻片预测肿瘤基因组变异方面,CHIEF优于目前的人工智能方法。这种新的人工智能方法成功地识别了与癌症生长和抑制相关的几个重要基因的特征,并预测了与肿瘤对各种标准疗法的反应有关的关键基因突变。CHIEF还检测到与结肠肿瘤对一种称为免疫检查点阻断的免疫疗法的反应有关的特定DNA模式。在观察整个组织图像时,CHIEF识别出54种常见突变癌症基因的突变,总体准确率超过70%,优于目前最先进的基因组癌症预测人工智能方法。对于特定癌症类型的特定基因,它的准确性更高。
该团队还测试了CHIEF预测与FDA批准的靶向治疗反应相关的突变的能力,这些突变涉及跨越15个解剖部位的18个基因。CHIEF在多种癌症类型中获得了很高的准确性,包括96%的检测EZH2基因突变,这种突变常见于一种叫做弥漫性大b细胞淋巴瘤的血癌。它对甲状腺癌的BRAF基因突变达到89%,头颈癌的NTRK1基因突变达到91%。
基于初始诊断时获得的肿瘤组织病理学图像,CHIEF成功预测了患者的生存。在研究的所有癌症类型和所有患者组中,CHIEF区分了长期生存患者和短期生存患者。CHIEF的表现比其他车型高出8%。在晚期癌症患者中,CHIEF的表现比其他人工智能模型高出10%。总的来说,CHIEF预测高与低死亡风险的能力在来自17个不同机构的患者样本中进行了测试和确认。
该模型确定了与肿瘤侵袭性和患者生存相关的图像上的泄密模式。为了可视化这些感兴趣的区域,CHIEF在图像上生成了热图。当人类病理学家分析这些人工智能衍生的热点时,他们看到了反映癌细胞和周围组织之间相互作用的有趣信号。其中一个特征是,与短期幸存者相比,长期幸存者的肿瘤区域存在更多数量的免疫细胞。Yu指出,这一发现是有意义的,因为免疫细胞的增加可能表明免疫系统已经被激活来攻击肿瘤。
当观察短期存活者的肿瘤时,CHIEF通过各种细胞成分之间的异常大小比例,细胞核上更多的非典型特征,细胞之间的弱连接以及肿瘤周围区域结缔组织的减少来识别感兴趣的区域。这些肿瘤周围也有更多的垂死细胞。例如,在乳腺肿瘤中,CHIEF将组织内坏死或细胞死亡的存在确定为感兴趣的区域。另一方面,存活率较高的乳腺癌患者更有可能保留类似于健康组织的细胞结构。研究小组指出,与生存相关的视觉特征和兴趣区域因癌症类型而异。
研究人员表示,他们计划通过以下方式改进CHIEF的性能并增强其能力:
对罕见疾病和非癌性疾病的组织图像进行额外训练
包括在细胞完全癌变前的癌前组织样本
让该模型接触更多的分子数据,以增强其识别不同侵袭性水平的癌症的能力
除了标准治疗之外,训练模型还可以预测新型癌症治疗的益处和副作用
知名企业招聘