综述:乳腺癌中的 DNA 甲基化:通过现有及新兴方法进行早期检测和生物标志物发现

【字体: 时间:2025年04月24日 来源:Journal of Translational Medicine 6.1

编辑推荐:

  乳腺癌严重威胁女性健康,早期检测意义重大。这篇综述聚焦乳腺癌中 DNA 甲基化(DNAm),探讨其用于早期检测和生物标志物发现的潜力,涵盖检测方法进展、相关生物标志物研究、多组学整合及机器学习应用,分析挑战并展望未来。

  

背景


乳腺癌是女性中最常见的恶性肿瘤之一,也是癌症相关死亡的主要原因。早期检测对改善乳腺癌患者的治疗效果和生存率至关重要。目前,乳房 X 光检查虽为乳腺癌筛查的金标准,但存在局限性,如在致密乳腺组织女性中敏感性降低,还可能导致假阳性和过度诊断。

DNA 甲基化作为一种关键的表观遗传修饰,在不改变 DNA 序列的情况下调控基因表达,对正常细胞功能至关重要。在乳腺癌中,肿瘤抑制基因(如 BRCA1、ITHI5、RASSF1A)的高甲基化和整体低甲基化与疾病发展和进展相关 。而且,甲基化变化常早于基因突变出现,肿瘤细胞内 DNA 甲基化模式相对一致,特定甲基化特征还能区分乳腺癌亚型,这些特点使 DNA 甲基化成为极具潜力的早期检测生物标志物。

液体活检是一种有前景的微创检测方法,可在血液、血浆等体液中检测肿瘤来源的生物标志物。其中,循环肿瘤 DNA(ctDNA)作为无细胞 DNA(cfDNA)的一部分,源于凋亡或坏死的肿瘤细胞,携带肿瘤的遗传和表观遗传改变,基于液体活检检测 ctDNA 甲基化,能为肿瘤生物学提供有价值信息。不过,检测肿瘤特异性 ctDNA 颇具挑战,尤其是在早期癌症中,其含量极低,需要高灵敏度检测技术。

DNA 甲基化检测方法的进展


DNA 甲基化分析是早期乳腺癌检测和生物标志物发现的有力策略,近年来检测方法不断进步。

传统的基于聚合酶链反应(PCR)的方法,如甲基化特异性 PCR(MSP)、定量 MSP(qMSP)和 MethyLight,可经济、灵敏地检测乳腺癌相关基因中高甲基化的 CpG 位点,但局限于预定义的 CpG 位点。液滴数字 PCR(ddPCR)和数字 PCR(dPCR)能提升低丰度甲基化信号的定量准确性,焦磷酸测序可对多个 CpG 位点进行实时、定量的甲基化分析,常用于生物标志物验证。甲基化阵列(如 Illumina Infinium Methylation BeadChips)可高通量分析多达 930,000 个 CpG 位点,助力大规模研究和风险预测,但同样受限于预定义区域。

基于下一代测序(NGS)的甲基化测序技术能实现全基因组单碱基分辨率的甲基化分析。全基因组亚硫酸氢盐测序(WGBS)是 DNA 甲基化研究的金标准,覆盖全面,但成本高、计算复杂。简化代表性亚硫酸氢盐测序(RRBS)通过靶向 CpG 富集区域降低成本,但基因组覆盖不完整。靶向甲基化测序针对临床相关 CpG 位点,适用于液体活检,但早期乳腺癌检测灵敏度仍有待提高。

新兴技术也在不断涌现。低输入和低通量 WGBS 技术降低了 DNA 输入量要求,提高了液体活检的可行性。靶向甲基化测序聚焦肿瘤特异性甲基化模式,如 AnchorIRIS 检测和增强线性片段扩增测序(ELSA-seq),提升了检测灵敏度和特异性,但早期癌症中 ctDNA 水平低影响检测可靠性。亚硫酸氢盐 - free 甲基化检测方法(如酶促甲基化测序(EM-seq)和 TET 辅助吡啶硼烷测序(TAPS))避免了亚硫酸氢盐转化的弊端,能更好地保留 DNA 完整性和测序准确性,还可与长读长测序平台结合。长读长测序技术(如 PacBio 单分子实时测序(SMRT 测序)和牛津纳米孔测序)可直接检测甲基化修饰,无需亚硫酸氢盐转化,但目前测序错误率和计算需求限制了其临床应用。

NGS 在乳腺癌甲基化检测中的应用


基于 NGS 的甲基化测序在乳腺癌检测、监测和治疗反应评估中发挥着重要作用,分为组织检测和液体活检两种策略。

组织检测能提供高分辨率的肿瘤甲基化图谱,但具有侵入性,不适合重复监测,且肿瘤异质性会导致甲基化差异,难以全面反映肿瘤的表观遗传状态。

液体活检通过分析血液或其他体液中的 ctDNA 甲基化,实现非侵入性检测,可实时追踪肿瘤的表观遗传变化,有助于早期检测和疾病监测。不过,早期乳腺癌中 ctDNA 丰度低、片段化严重,且存在非肿瘤来源 cfDNA 的干扰,增加了检测和数据解读的难度。

肿瘤知情的液体活检方法利用已知的肿瘤甲基化特征提高检测特异性,但早期乳腺癌中 ctDNA 水平低、背景干扰大,且肿瘤甲基化异质性会影响检测效果,获取肿瘤活检数据也较为困难,限制了其在大规模筛查中的应用。肿瘤未知的方法可从头识别乳腺癌特异性甲基化标记,全基因组亚硫酸氢盐测序(WGBS)和 cfMeDIP-seq 等技术已在其中发挥重要作用,一些研究开发的检测方法在早期乳腺癌检测中表现出良好的性能,更适合早期筛查和诊断。

早期乳腺癌诊断的 DNA 甲基化生物标志物


近年来,DNA 甲基化标记作为潜在的液体活检生物标志物受到广泛关注,但目前极少有基于血液的 DNA 甲基化标记获临床批准用于乳腺癌早期检测和诊断,多数仍处于研究阶段。少数研究评估了部分标记在早期乳腺癌中的检测性能,如 Moss 等人发现由 KRT19、LMX1B 和 ZNF296 组成的标记 panel 可有效识别乳腺癌患者;Liu 等人开发的包含 10 个 cfDNA 甲基化标记的模型,区分恶性和良性乳腺癌样本的曲线下面积(AUC)达 0.81,与传统诊断方法结合可显著提高早期乳腺癌的检测率;Wang 等人开发的多重甲基化特异性定量 PCR 检测,利用 4 个乳腺癌特异性 CpG 甲基化标记,区分早期乳腺癌患者和正常对照的总体检测率达 82%,高于传统肿瘤标记 。

不同乳腺癌亚型具有独特的甲基化模式,识别能区分正常和癌症患者、分层乳腺癌亚型的诊断生物标志物,有助于实现个性化治疗。有研究通过全基因组甲基化分析鉴定出可有效分类健康个体和早期乳腺癌患者的 ctDNA 标记,以及区分雌激素受体(ER)状态的标记。针对三阴性乳腺癌(TNBC)的研究较多,如 Manoochehri 等人鉴定出 TNBC 特异性甲基化标记,其基于 3 个差异甲基化区域(DMRs)计算的甲基化评分,在区分 TNBC 患者和健康个体方面有一定潜力;还有研究开发的 mDETECT 检测,用于检测和监测转移性 TNBC,效果良好,但部分标记的临床意义尚待明确。

早期乳腺癌检测的多组学整合方法


单组学数据难以全面揭示癌症的复杂性,多组学整合(涵盖基因组学、表观基因组学、片段组学、转录组学、蛋白质组学和代谢组学等数据)能更深入地理解癌症的发生机制,提高癌症检测灵敏度。

整合多组学数据面临诸多挑战,如生物变异性、计算复杂性、数据噪声等,先进的计算技术(尤其是机器学习(ML)和人工智能(AI))可用于提取有意义的信息,助力生物标志物发现。例如,Xu 等人整合全基因组甲基化谱、转录组和代谢组数据,显著提高了区分导管原位癌(DCIS)和浸润性乳腺癌(IBC)的灵敏度;深度学习模型在乳腺癌亚型分类和预后预测方面表现出色 。

片段组学通过分析 cfDNA/ctDNA 的片段化模式和大小特征,为早期癌症检测提供了新视角。肿瘤来源的 ctDNA 片段具有独特特征,可作为生物标志物。将 cfDNA 甲基化与片段组学特征相结合,利用 ML 算法能显著提高乳腺癌检测准确性。

DNA 甲基化在多癌早期检测(MCED)中是关键生物标志物,全基因组甲基化模式预测准确性高,在识别肿瘤组织来源(TOO)方面也发挥着重要作用。整合 DNA 甲基化与其他 cfDNA 衍生特征,可提高早期恶性肿瘤的检测和定位能力。先进的多组学和计算方法已应用于 MCED 检测,如 Bie 等人开发的 THEMIS 集成学习分类器,整合多种特征,在检测多种癌症(包括乳腺癌)方面表现良好;Nguyen 等人的研究也证实了整合甲基化、片段组学等特征可提升 MCED 性能 。

MCED 检测在乳腺癌中的表现


目前,多数 MCED 检测聚焦于检测 cfDNA 中的突变和片段化模式,少数如 Galleri(GRAIL)和 PanSEER(Singlera Genomics)专注于检测癌症特异性 DNA 甲基化模式,其中 Galleri 可检测包括乳腺癌在内的 50 多种癌症 。

CCGA 研究为 Galleri 检测的开发奠定了基础,但其在乳腺癌检测中的灵敏度较低,尤其是早期乳腺癌,I 期乳腺癌的检测率仅为 2.6% 。PATHFINDER 研究在真实世界中评估了 Galleri 检测,发现其在早期乳腺癌检测方面存在局限性,但在监测癌症复发方面有一定潜力。MCED 检测的阳性预测值(PPV)相对较高,但 Galleri 检测在真实世界中的灵敏度低于临床试验,且面临有效性、伦理等方面的质疑,其广泛应用前需进行严格的独立验证。

基于甲基化的液体活检检测的临床验证和实用性


基于甲基化的液体活检检测的临床验证对评估其在早期乳腺癌检测中的实际效果至关重要,但目前尚无基于血浆或血液的 DNA 甲基化标记获批准用于乳腺癌筛查或诊断。多项研究评估了大量 DNA 甲基化生物标志物,但多数诊断性能有限,且缺乏标准化,导致难以验证。唯一针对早期乳腺癌检测评估 ctDNA 甲基化的临床试验因样本采集问题提前终止。

甲基化相关的 MCED 检测(如 Galleri)在早期乳腺癌检测中的表现不佳,I 期乳腺癌检测灵敏度低至 2.6% 。为提高临床适用性,可采用多组学整合方法,但这些方法仍处于实验阶段,需大规模前瞻性临床试验验证其相对于现有筛查方法的优势。

挑战和局限性


基于甲基化的液体活检在早期乳腺癌检测方面前景广阔,但面临诸多挑战。

在早期乳腺癌中,ctDNA 水平极低,肿瘤脱落有限且半衰期短,导致捕获肿瘤来源的甲基化信号困难,影响检测准确性。而且,不同乳腺癌亚型的 ctDNA 脱落情况不同,如 TNBC 脱落的 ctDNA 多于激素受体阳性亚型,增加了开发通用检测方法的难度。高灵敏度检测虽必要,但可能导致过度诊断,引发不必要的干预和治疗。

检测的可重复性和标准化面临挑战,样本采集、处理和存储等预分析因素会影响 ctDNA 完整性,不同实验室的样本处理方式存在差异。甲基化分析方法也存在不一致性,如 DNA 提取、亚硫酸氢盐转化、测序深度和生物信息学分析流程的差异,会导致检测灵敏度差异,限制了检测的可重复性。目前,许多早期乳腺癌 ctDNA 研究对分析有效性的报告不足,缺乏标准化阻碍了检测的临床应用。

DNA 甲基化模式受年龄、合并症、环境暴露和生活方式等因素影响,这些因素可能导致假阳性或错误分类,在临床应用前需进行严格的验证研究以排除干扰。

监管方面,甲基化检测用于临床需经严格验证,证明其分析有效性、临床有效性和临床实用性,但目前尚无相关检测获美国食品药品监督管理局(FDA)批准用于早期乳腺癌检测。检测方法缺乏标准化性能标准,不同研究难以比较,行业指南和熟练度测试对促进监管批准至关重要。此外,报销政策也是一大障碍,多数保险公司将此类检测视为实验性项目,缺乏标准化计费代码,公共资助系统还要求进行成本效益分析,检测成本高、实验室基础设施和生物信息学专业知识要求高,也限制了其临床应用,提高临床医生和患者对检测的认知同样重要。

结论和未来展望


基于甲基化的生物标志物在早期癌症检测中潜力巨大,液体活检技术、多组学整合和 ML 驱动的分析推动了检测发展,发现了众多潜在生物标志物。但仍面临检测验证、ctDNA 丰度低和临床性能差异等挑战。

为解决 ctDNA 水平低的问题,研究人员开发了可暂时提高血液中 cfDNA 水平的 “启动剂”,检测母乳中的 ctDNA 也为早期乳腺癌诊断提供了新思路。未来,多组学整合将是提升检测准确性和临床实用性的关键,整合 DNA 甲基化与 ctDNA 片段化特征、多种生物标志物(如蛋白质 - DNA 突变、DNA 甲基化与基因表达数据),或纳入蛋白质组学、代谢组学、外泌体和影像学数据,有望进一步提高诊断准确性,助力个性化治疗。不过,多组学整合也带来了数据复杂、成本高和计算需求大等问题。先进的 AI 和 ML 技术将在实时分析肿瘤来源的甲基化模式、提高生物标志物发现的准确性和可扩展性方面发挥重要作用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号