基于多组学分析筛选结直肠癌相关自身抗原及对应自身抗体的诊断效能评估

【字体: 时间:2025年04月17日 来源:BMC Cancer 3.4

编辑推荐:

  结直肠癌(CRC)严重威胁健康,现有诊断方法存在不足。研究人员开展筛选 CRC 新型生物标志物的研究,通过多组学分析找到 12 种潜在肿瘤相关抗原(TAAs),5 种对应自身抗体(TAAbs)有诊断价值,构建的随机森林(RF)模型可辅助诊断,为 CRC 诊断提供新方向。

  在全球范围内,结直肠癌(Colorectal Cancer,CRC)是一种严重威胁人类健康的恶性肿瘤。它是全球第三大常见癌症 ,也是癌症相关死亡的第二大原因。随着生活方式的改变,近年来其发病呈现出年轻化的趋势。目前,虽然乙状结肠镜和结肠镜检查是 CRC 诊断的金标准,但它们属于侵入性检查,部分患者接受度较低。粪便检测虽然较为便捷,但粪便免疫化学检测对 CRC 检测的灵敏度仅为 67.3%,多靶点粪便 DNA 检测灵敏度虽高(93.9%)但成本较高。血液检测方面,FDA 批准的甲基化 SEPT9 作为血液生物标志物,其检测早期 CRC 的灵敏度仅 44.7%,对晚期腺瘤的检测灵敏度更是低至 11.2%。传统临床肿瘤标志物如癌胚抗原(CEA)和糖类抗原 19 - 9(CA19 - 9),在 CRC 诊断中的灵敏度也十分有限。因此,开发高效、便捷且患者友好的 CRC 诊断方法迫在眉睫。
为了解决这些问题,郑州大学的研究人员开展了一项极具意义的研究。他们旨在筛选并验证新型生物标志物,并开发一个易于使用的在线工具用于 CRC 的检测。该研究成果发表在《BMC Cancer》杂志上。

研究人员采用了多种关键技术方法。在样本方面,收集了 300 例 CRC 患者和 300 例健康对照(Healthy Controls,HCs)的血清样本,这些样本来自河南肿瘤流行病学重点实验室生物样本库。在技术手段上,运用了多组学方法,包括从 Gene Expression Omnibus(GEO)数据库获取单细胞转录组数据,从 Clinical Proteomic Tumor Analysis Consortium(CPTAC)数据库下载蛋白质组数据;利用酶联免疫吸附试验(Enzyme - linked Immunosorbent Assays,ELISA)检测血清中肿瘤相关自身抗体(Tumor - associated Autoantibodies,TAAbs)水平;借助 “tidymodels” R 包运用 10 种机器学习算法构建诊断模型 。

研究结果如下:

  • 候选 TAAs 的鉴定:通过单细胞转录组数据分析,利用 R 包 Seurat 进行数据转换、质量控制等操作,鉴定出上皮细胞及其亚型。对比肿瘤和正常上皮细胞,发现 800 个上调基因,以及在四种共识分子亚型(Consensus Molecular Subtypes,CMS)中均过表达的 1226 个基因。从蛋白质组数据中鉴定出 284 个上调蛋白。经过一系列筛选策略,最终确定了 12 种潜在的 TAAs,包括 HMGA1、NPM1 等,这些基因富集在与癌症发生和进展密切相关的通路中。
  • TAAbs 的诊断性能评估:ELISA 结果显示,在验证阶段,6 种 TAAbs(抗 CKS1B、抗 ACTG1、抗 S100A11、抗 maspin、抗 ANXA3 和抗 eEF2)在 CRC 患者和健康对照之间存在显著差异。在验证阶段,这 6 种 TAAbs 的 AUC 值范围为 0.58 - 0.64;在验证阶段,其中 5 种 TAAbs(除抗 ACTG1 外)表现出潜在的诊断价值,AUC 范围为 0.53 - 0.69 。
  • 免疫诊断模型的性能:运用 10 种机器学习算法构建诊断模型,在训练集中,模型的 AUC 值范围为 0.67 - 0.84,准确率范围为 61.90 - 72.62%;在测试集中,AUC 范围为 0.63 - 0.77,准确率范围为 61.11 - 68.33%。Stacking 模型在训练集中表现最佳(AUC:0.84,95% CI = 0.80 - 0.87),随机森林(Random Forest,RF)模型次之(AUC:0.82,95% CI = 0.78 - 0.86)。但决策曲线分析(Decision Curve Analysis,DCA)表明 RF 模型在临床应用中更具优势,因此选择 RF 模型进行后续研究。RF 模型在训练集和测试集中表现稳定,训练集 AUC 为 0.82(95% CI:0.78 - 0.86),准确率 68.10%;测试集 AUC 为 0.75(95% CI:0.68 - 0.82),准确率 67.22%。
  • 联合诊断的优势:将 RF 模型与 CEA 和 CA19 - 9 联合使用,显著提高了诊断的阳性率。在训练集中,RF 模型阳性率为 50.3 - 50.5%,CEA 和 CA19 - 9 分别为 39.6% 和 20.2%,三者联合后阳性率提升至 75.0%;在测试集中,RF 模型阳性率为 51.8%,CEA 和 CA19 - 9 分别为 34.1% 和 12.9% ,联合后阳性率达到 65.9%。
  • 亚组分析:在训练数据集进行亚组分析发现,该模型对 50 岁及以上人群的诊断效果明显优于 50 岁以下人群,但在疾病早期和晚期阶段,模型性能差异无统计学意义。

研究结论和讨论部分指出,该研究成功开发并验证了一种基于 TAAbs 和机器学习模型的新型 CRC 诊断方法。通过多组学分析筛选出的 5 种 TAAbs,与传统生物标志物 CEA 和 CA19 - 9 联合使用,显著提高了 CRC 的诊断性能。这为 CRC 的早期诊断提供了新的思路和方法,有望在临床实践中发挥重要作用。不过,该研究也存在一定的局限性,如样本量相对有限,研究人群主要来自中国中部地区,可能影响研究结果的普遍性;未评估吸烟、饮酒等潜在混杂因素的影响。未来需要开展大规模、多中心的研究,进一步验证该模型的诊断性能及其在不同人群中的适用性 。总的来说,这项研究为结直肠癌的诊断开辟了新的道路,具有重要的科学意义和临床应用潜力。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号