深度学习助力卵巢癌同源重组缺陷状态精准判断

【字体: 时间:2025年03月05日 来源:Journal of Translational Medicine 6.1

编辑推荐:

  为解决卵巢癌 HRD 状态检测难题,研究人员构建深度学习模型,可精准判别肿瘤组织及 HRD 状态,意义重大。

  卵巢癌,作为严重威胁全球女性健康的三大生殖系统肿瘤之一,如同隐匿在黑暗中的 “杀手”。它早期症状不典型,缺乏有效的筛查手段,多数患者确诊时已处于晚期,肿瘤发生远处转移,预后极差。目前,手术联合化疗是主要治疗方式,但多数患者会复发并发展为铂耐药,前景不容乐观。
在细胞层面,同源重组缺陷(HRD)指的是同源重组修复(HRR)功能出现异常,这可能由 HRR 相关基因的种系或体细胞突变、表观遗传失活等多种因素导致。正常情况下,人体面对细胞 DNA 损伤时,HRR 等多种修复方式会发挥作用来修复损伤。然而,当存在 HRD 时,DNA 损伤无法被 HRR 正确修复,DNA 双链断裂不断积累,进而引发基因组和染色体不稳定。PARP 抑制剂作为一类抗肿瘤药物,能够抑制 PARP 酶的功能,阻断 DNA 损伤修复途径,促进肿瘤细胞凋亡。对于 HRD 状态的卵巢癌患者,PARP 抑制剂的抗肿瘤效果更为显著。因此,准确评估 HRD 状态,对卵巢癌患者的治疗方案制定、疗效评估以及预后预测都至关重要。但现有的 HRD 临床检测方法,如 HRR 相关基因突变检测、基因组瘢痕和突变谱系分析、HRD 功能检测等,存在成本高、耗时长的问题,在欠发达地区难以广泛应用,急需更高效便捷的检测系统。
在此背景下,东南大学附属中大医院等机构的研究人员开展了一项极具意义的研究,相关成果发表在《Journal of Translational Medicine》上。研究人员旨在构建基于深度学习的分类器,从全切片图像(WSIs)中识别肿瘤区域,并对卵巢癌患者的 HRD 状态进行分层。
为开展此项研究,研究人员收集了来自纪念斯隆凯特琳癌症中心(MSKCC)的 183 例和东南大学附属中大医院的 22 例卵巢癌患者数据,共 205 例患者。这些患者均提供了术后病理确诊结果、HRD 状态信息、数字扫描病理切片及全面临床数据。研究人员获取常规苏木精 - 伊红(H&E)染色诊断组织切片的 WSIs,由两位专业病理学家评估切片质量,选取每例患者质量最高的一张切片用于研究。在 HRD 检测方面,MSKCC 研究团队通过临床测序推断 HRD 状态,中大医院则与南京先声公司合作,利用下一代测序(NGS)技术检测 BRCA1/2 等 HRR 相关基因突变,并计算 HRD 评分来综合判断 HRD 状态。同时,研究人员借助 QuPath 软件,由两位经验丰富的病理学家标注病理切片中的肿瘤和其他组织区域,若标注存在分歧,则由资深病理学家最终裁定。采用 512 像素 ×512 像素的滑动窗口从 20x 全视野数字切片中提取图像块,输入 UNet++ 模型进行训练。利用 Hover - Net 模型对肿瘤区域内的细胞进行分割、对细胞核进行分类,并计算相关形态、纹理和空间特征。此外,研究人员还运用了最小冗余最大相关性(mRMR)、最小绝对收缩和选择算子(LASSO)、随机森林(RF)三种特征选择方法,并结合逻辑回归(LR)、k 近邻(KNN)、支持向量机(SVM)、随机森林(RF)四种机器学习分类器构建模型。
研究结果如下:
  • 肿瘤区域识别与模型性能:UNet++ 算法在分割肿瘤区域时表现出色,准确率达到 81.8%,召回率为 85.9%,Dice 系数为 83.8%,交并比(IoU)为 68.3%。在区分卵巢癌 HRD 和同源重组 proficient(HRP)亚型的 12 种特征选择和分类器组合方案中,RF 和 RF 分析的组合在不同数据集上表现最佳。将三个基于不同数据集构建的模型(Model 1 - 3)集成得到的 Ensemble Model,在外部测试组中的 AUC 为 0.769,精度为 0.800,召回率为 0.727,F1 分数为 0.762 ,显示出良好的性能。
  • 判别特征:研究发现,S_mean_dln_obtuse_ratio、S_mean_dln_acute_ratio 和 mean_Graph_T - S_Betweenness_normed 这三个特征在所有模型中均存在。HRD 患者的肿瘤浸润淋巴细胞核空间排列更分散,且肿瘤细胞与坏死细胞的距离明显更近,这表明 HRD 状态可能对肿瘤微环境和细胞间相互作用有显著影响。
研究结论表明,基于深度学习的病理图像分析能够有效完成常规病理任务。研究人员构建的模型可以准确区分卵巢癌中的肿瘤和非肿瘤组织,并预测患者的 HRD 状态。这一成果为卵巢癌的临床诊疗提供了新的思路和方法,有望改善患者的治疗效果和预后。不过,该研究也存在一定局限性,如未控制病理切片质量、患者人口统计学差异和治疗措施等混杂变量,样本量相对有限。后续研究需要进一步解决这些问题,扩大样本量,纳入更多外部验证队列,以提升模型的可靠性和泛化能力,更好地应用于临床实践。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
生物通微信公众号
微信
新浪微博

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号