-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:胃癌管理中的人工智能革命
《Cancer Cell International》:The artificial intelligence revolution in gastric cancer management: clinical applications
【字体: 大 中 小 】 时间:2025年03月23日 来源:Cancer Cell International 5.3
# 胃癌管理中的人工智能革命:临床应用
胃癌是全球范围内高发且恶性程度高的肿瘤疾病,发病率位居第五,死亡率第四。东亚地区发病率最高,虽然部分地区发病率呈下降趋势,但预计到 2040 年全球胃癌负担将增加 62% 。幽门螺杆菌(Helicobacter pylori,Hp)感染是主要危险因素,成功根除 Hp 可降低 34 - 53% 的胃癌发病率。早期胃癌患者行根治性手术,五年生存率超 90%,然而早期症状隐匿,超 80% 患者确诊时已处于晚期,晚期患者五年生存率不足 10% 。
传统治疗手段如化疗、放疗和靶向治疗存在诸多局限,免疫治疗虽带来突破,但响应率限制了其广泛应用。在此背景下,人工智能(artificial intelligence,AI)技术的发展为胃癌管理带来新契机,其融合计算机科学与大量数据,涵盖机器学习(machine learning,ML)和深度学习(deep learning,DL)等领域,正逐步改变胃癌的诊疗格局。
尽管根除 Hp 策略降低了胃癌风险,但根除后个体患癌风险仍高于普通人群。多项研究利用 AI 技术对 Hp 感染进行诊断和风险预测。例如,Lin 等人开发的 scSE-CatBoost 分类系统,通过预处理内镜图像诊断 Hp 感染,准确率达 0.90,灵敏度为 1.00,特异性为 0.81,阳性预测值为 0.82,阴性预测值为 1.00,曲线下面积(area under the curve,AUC)为 0.88 。Nakashima 等人开发的计算机辅助诊断(computer-aided diagnostic,CAD)系统能将患者 Hp 感染状态分为未感染、感染和已根除三类,准确率分别为 84.2%、82.5% 和 79.2% 。Leung 等人评估不同机器学习模型预测 Hp 根除后胃癌风险的性能,其中 XGBoost 模型表现最佳,AUC 达 0.97 。此外,ABC 方法结合 Hp 感染检测与血清胃蛋白酶原水平,可有效区分胃癌高危和低危人群;Murphy 等人基于血清胃蛋白酶原和 13 种 Hp 抗原抗体反应,利用最小绝对收缩和选择算子(Minimal Absolute Contraction and Selection Operator,LASSO)建立风险分层模型,AUC 更高,为胃癌风险评估提供了更准确的工具。
根据 Correa 级联反应,胃癌的病理演变具有多阶段转化特征,早期诊断对提高治愈率和预后至关重要。Fang 等人利用半监督深度学习 GasMIL 算法对疑似萎缩性胃炎患者的病理图像进行诊断和分级,该算法在外部测试集中诊断肠化生和萎缩性胃炎的 AUC 分别为 0.884 和 0.877 。Iwaya 等人建立 DCNN 模型和 ResNet50 对有无肠化生的图像进行分类,灵敏度达 97.7%,特异性为 94.6%,有助于对慢性胃炎患者的个体胃癌风险进行分类 。Shi 等人使用深度学习 DLDA 模型训练和测试患者病理图像,实现肠化生和发育异常的自动诊断,内部验证队列 AUC 为 0.97,独立外部验证队列宏观平均 AUC 从 0.67 提升至 0.82,且通过域自适应优化技术对发育异常进行详细分类,为胃癌早期筛查和风险评估开辟了新途径。
胃肠道间质瘤(gastrointestinal stromal tumors,GISTs)和胃肠道平滑肌瘤是常见的黏膜下病变,GISTs 被视为潜在恶性肿瘤。Hirai 等人利用 AI 对图像进行分类,有效区分包括 GISTs、平滑肌瘤、神经鞘瘤和异位胰腺在内的五种病变,总体准确率达 86.1%,在区分 GISTs 与非 GISTs 时,灵敏度为 98.8%,特异性为 67.6%,准确率为 89.3% 。Yang 等人开发的人工智能系统用于联合诊断,使内镜医师诊断 GISTs 或胃肠道平滑肌瘤的准确率从 73.8% 提高到 88.8% 。Zhang 等人对七项研究进行系统回顾和分析,发现 AI 辅助内镜下区分 GISTs 与其他黏膜下肿瘤的合并灵敏度、特异性、阳性和阴性似然比分别为 0.92、0.82、4.55 和 0.12,总诊断优势比(diagnostic odds ratio,DOR)和 AUC 分别为 64.70 和 0.950,表明 AI 在自动诊断胃肠道间质瘤方面具有高精度和可靠性。
内镜是检测早期胃癌肿瘤的关键工具,但受光源照明影响,存在阴影或反射问题,影响观察清晰度和诊断准确性 。Dong 等人开发的可解释 AI 系统 ENDOANGEL-ED,在人机对比中优于所有内镜医师,内部评估准确率为 81.10%,外部视频评估准确率为 88.24% 。Gong 等人引入的深度学习系统对四种病变(进展期胃癌、早期胃癌、发育异常和非肿瘤)进行分类,准确率达 89.7%,可在实时内镜检查中自动检测和分类胃肿瘤 。Yuan 等人开发的人工智能系统在白光内镜下诊断六种胃病变的准确率为 85.7%,与高级内镜医师相当(85.1%)且高于初级内镜医师(78.8%) 。Wu 等人利用 9151 张图像建立 DCNN 系统检测早期胃癌,准确率达 92.5%,还利用 24549 张不同胃部图像训练 DCNN 识别食管胃十二指肠镜检查中的盲点,在将胃部位置分为 10 或 26 部分的任务中,准确率分别达到 90% 或 65.9%,与专家相当,为增强内镜训练质量提供了技术支持。
传统诊断方法存在复杂性高、耗时、劳动强度大且依赖医师经验等局限。AI 在医学领域的融合正革新传统诊疗方式。Zhang 等人开发的深度学习系统区分六种胃病变,在识别早期胃癌和高级别上皮内瘤变方面,CNN 的准确率与内镜医师相当,且诊断特异性和阳性预测值(positive predictive value,PPV)更高(特异性:91.2% vs. 86.7%;PPV:55.4% vs. 41.7%) 。Ikenoyama 等人对比 CNN 与内镜医师,发现 CNN 诊断速度快(45.5 ± 1.8 s),灵敏度高(58.4%,比医师高 26.5%),同时保持高特异性(87.3%)、良好的 PPV(26.0%)和阴性预测值(negative predictive value,NPV)(96.5%) 。Noda 等人利用残差神经网络分析胃癌图像仅需 7 s,准确率、灵敏度、特异性等关键指标均超过内镜医师,在病变分析方面表现突出(准确率 86.1%,灵敏度 82.1% 等) 。He 等人开发的 ENDOANGEL-ME 系统,内部和外部测试集及视频准确率均超 90%,显著优于高级内镜医师的平均水平(70.16% ± 8.78%) 。Goto 等人使用人工智能分类器区分黏膜内癌和黏膜下癌,准确率、灵敏度、特异性和 F1 值分别为 77%、76%、78% 和 0.768,内镜医师的相应值为 72.6%、53.6%、91.6% 和 0.662,证实 AI 与医师协作可增强早期胃癌浸润深度的诊断能力。Zhang 等人利用 AIAG 系统诊断疑难病例,灵敏度为 79.69%,特异性为 73.26%,均优于普通内镜医师,AI 显著提高中级医师的诊断特异性(59.79% vs. 52.62%),而专家表现不受影响,表明 AI 对中级医师识别胃肿瘤的诊断能力有显著影响。Niikura 等人对比 AI 与专家内镜医师的诊断准确性,AI 组诊断准确率更高(100% vs. 94.12%),图像诊断率也更高(99.87% vs. 88.17%) 。
胃癌症状因进展阶段而异,图像的人工分割面临挑战,如黏膜特征多样、病变边缘不规则以及与正常黏膜差异细微等 。Zhang 等人提出改进的 Mask R-CNN(IMR-CNN)模型,通过识别和验证早期胃癌图像,对胃镜图像中的胃癌病变进行识别和分割,精度、召回率、准确率、特异性和 F1-Score 值分别为 92.9%、95.3%、93.9%、92.5% 和 94.1% 。Du 等人提出基于共空间注意力和通道注意力的三分支自动分割框架(CSA-CA-TB-ResUnet),实现了 84.54% 的杰卡德相似系数(Jaccard similarity index)、81.73% 的阈值杰卡德指数(threshold Jaccard index)、91.08% 的 Dice 相似系数和 91.18% 的像素级准确率,证明胃镜图像间的相关信息可提高早期胃癌病变的精确分割 。Sun 等人提出使用生成对抗训练的胃病变分割新网络,实验结果显示 dice 值、准确率和召回率分别为 86.6%、91.9% 和 87.3%,优于现有模型。这些研究表明 AI 可提供高精度、快速、一致且实时的自动化解决方案,提高内镜图像分割性能,进而提升临床医师的诊断效率和准确性。
由于胃肿瘤病变的精细性和内镜医师技能差异,临床内镜检查可能出现漏诊或误诊 。Wu 等人在不增加检查时间的情况下,有效降低了 AI 优先组胃肿瘤的漏诊率(6.1% vs. 27.3%),同时减少了不必要的活检 。Namikawa 等人开发的人工智能诊断系统在病变水平对胃癌和胃溃疡进行分类,以降低临床误诊率,总体准确率分别为 45.9%(胃癌 100%;胃溃疡 0.8%)和 95.9%(胃癌 99.0%;胃溃疡 93.3%) 。借助 AI,医生能更有效地利用患者信息提高诊断准确性,减少误诊或漏诊导致的悲剧。
内镜和病理活检是目前胃癌诊断的首选方法,病理是肿瘤诊断的 “金标准”。但随着科技发展,病理学面临诸多挑战,如病理医师短缺,尤其在医疗资源相对匮乏的偏远地区和县级医院;长期高强度工作可能导致病理医师精力不足,加上医师临床经验差异和主观解读的必然性,增加了诊断结果的不确定性 。AI 技术的兴起为这一传统领域注入活力,其强大的数据处理能力和深度学习算法可实现对全切片数字图像(whole-slide digital images,WSI)的高效自动化分析,准确识别病变类型,评估病变程度,为年轻临床医师提供有力辅助支持。
许多先进医疗机构已开展 “数字病理和智能病理” 的探索与实践。Hu 等人发布的胃组织病理学亚尺寸图像公共数据库(GasHisSDB),在传统机器学习中最高准确率为 86.08%,最低为 41.12%,深度学习最高准确率达 96.47%,最低为 86.21% 。Song 等人开发的临床上适用的 CNN 系统,在 2123 张像素级标注的胃癌苏木精 - 伊红(hematoxylin and eosin,H&E)染色 WSI 上训练后,在真实世界测试数据集上实现了近 100% 的灵敏度和 80.6% 的平均特异性 。Ba 等人基于 WSI 进行完全交叉多读者多病例研究,发现深度学习辅助病理医师解读 110 张 WSI 时,AUC(0.911 vs. 0.863)高于未辅助的病理医师,表明深度学习提高了病理医师诊断胃癌的准确性和效率 。Tan 等人开发并验证的人工智能放射病理学模型,在训练和验证队列中的 AUC 分别为 0.953 和 0.851,在区分 I - II 期和 III 期胃癌方面表现出色 。Huang 等人开发的深度学习模型,从 1037 名患者收集 2333 张病理图像,在外部验证集中准确率达 0.920 。Veldhuizen 等人构建的基于深度学习的胃癌组织学亚型分类器,在三个队列 731 名患者中进行五折交叉内部验证,平均 AUC 为 0.93 ± 0.07 。Liu 等人将飞秒受激拉曼散射(femtosecond stimulated Raman scattering,femto-SRS)和 U-Net 技术相结合,实现了胃镜和组织病理学的同步诊断,对活检样本进行快速高灵敏度成像和诊断,为早期胃癌筛查和治疗赢得宝贵时间。
淋巴结转移是胃癌扩散的重要途径,晚期胃癌淋巴结转移率超 70% 。病理医师需在光学显微镜下仔细检查所有解剖来源的淋巴结切片,评估每个淋巴结的状态和总数,但仍难以消除误诊风险。由于技术限制,实际获取的淋巴结数量可能无法满足准确预后的需求,导致 N 分期不准确。为此,行业尝试引入淋巴结转移比例作为 AJCC N 分期的补充指标,但存在局限性,难以完全替代传统 N 分期标准。
Wang 等人利用深度学习从切除的淋巴结 WSI 预测胃癌,并揭示肿瘤与淋巴结转移面积比 。Muti 等人开发并验证的深度学习系统,从 1146 名患者的 WSI 队列直接预测淋巴结转移(lymph node metastasis,LNM)状态,准确率分别为 0.71、0.69 和 0.65 。Hu 等人基于深度学习算法将 921 张淋巴结 WSI 分为训练组和测试组,利用 327 张未标记图像进行前瞻性测试以验证诊断系统性能,淋巴结定量准确率达 97.13%,Xception 和 DenseNet-121 组合模型的 PPV 为 93.53%,NPV 为 97.99%,在淋巴结诊断方面高效准确,有助于病理医师对胃癌患者淋巴结转移进行初步筛查 。Zhang 等人设计的 3D 增强特征金字塔网络在四个医学中心收集的 CT 图像数据集上进行实验,结果证实该方法提高了淋巴结转移的诊断准确性,优于现有方法 。淋巴管侵犯(lymphovascular invasion,LVI)是胃癌的预后因素,LVI 与淋巴结转移的可能性更高相关,患者总体预后更差 。Lee 等人引入基于深度学习的方法检测淋巴管浸润(+),ConViT 模型在多分类模型中使用 H&E 染色 WSI,AUROC 为 0.9796,AUPRC 为 0.9648,有望推进精准医学,节省检查时间和人力,减少病理医师之间的差异。
病理医师需对大组织样本进行细致分析,进行全面病理检查以确定疾病类型、严重程度和范围,这一过程涉及在显微镜下检查组织切片、诊断疾病、评估病变特征并与临床医师协作制定治疗计划,同时还需与外科、放射科等团队密切合作,对临床病理医师而言任务艰巨 。
为减轻病理医师诊断胃活检的工作量,Abe 等人引入 AL 胃活检病理诊断系统(AI-G),利用病理多阶段语义分割(MSP)方法分析从 WSI 切片中提取的特征值分布,在组织水平验证中,MSP AI-G 的准确率(91.0%)高于传统补丁 AI-G(PB AI-G)(89.8%),在 10 个不同机构的队列测试中,MSP AI-G 在组织水平分析中的准确率(0.946)也始终高于 PB AI-G(0.861) 。Park 等人开发的 CNN 算法可自动对 2434 张 WSI 进行分类,通过 AUROC 评估的两级分类诊断性能为 0.9790,能区分阴性(NFD)和阳性(除 NFD 外的所有病例),对于上皮肿瘤,灵敏度和特异性分别为 1.000 和 0.9749,表明其可作为诊断胃活检标本的筛查辅助系统。
内镜下黏膜下剥离术(endoscopic submucosal dissection,ESD)是一种成熟的内镜切除方法,可实现早期胃肠道肿瘤的高整体切除率 。未分化早期胃癌是 ESD 的适应证之一,但根治性切除率仍不理想。Bang 等人开发的极端梯度提升分类器,基于病变的形态和生态特征,在 ESD 前预测未分化早期胃癌的根治性切除,内部验证准确率、精度、召回率和 F1 分数分别为 93.4%、92.6%、99.0% 和 95.7% 。Yun 等人创建的预测早期胃癌 ESD 非治愈性切除的模型,在内部验证中具有良好的判别性能(AUC 0.851) 。
ESD 技术要求高且并发症风险高,病变位置会影响操作难度。Kim 等人开发的胃模拟器可用于练习胃 ESD 的各种位置,在具有挑战性的位置,机器人辅助 ESD 的手术时间显著短于传统 ESD(6.2 vs. 10.2 min),主要是由于更快的剥离速度(220.3 vs. 101.9 mm2/min),且盲剥离率显著低于<
知名企业招聘
今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号