-
生物通官微
陪你抓住生命科技
跳动的脉搏
纳米孔测序准确检测单链和双链上的5mC和5hmC
【字体: 大 中 小 】 时间:2025年02月17日 来源:Communications Biology 5.2
英国巴斯大学生命科学系的研究人员近日在《Communications Biology》期刊上发表了题为 “Double and single stranded detection of 5-methylcytosine and 5-hydroxymethylcytosine with nanopore sequencing” 的论文。
这篇论文对 DNA 甲基化研究领域意义重大,为深入探究 5-甲基胞嘧啶(5mC)和 5-羟甲基胞嘧啶(5hmC)等修饰在生物过程中的作用提供了新的视角和方法,有助于推动生物医学在疾病、衰老和发育等相关领域的研究进展。
研究背景
5mC 和 5hmC 作为 DNA 中胞嘧啶的化学修饰形式,在转录调控中发挥着重要作用,与许多生物过程和疾病,如发育、衰老和癌症等密切相关。在真核基因组里,这些修饰集中在 CpG 位点。DNA 甲基转移酶(DNMT1)可在这些位点对称地维持甲基化状态,即正义和反义链的胞嘧啶碱基上都存在甲基化。
然而,近年来有研究表明,半甲基化(5mC 仅存在于一条链上)在细胞分裂后也能稳定维持,并影响 DNA 与转录因子的相互作用。5mC 经 TET 家族蛋白氧化后可生成 5hmC,5hmC 对于维持胚胎干细胞的多能性、神经发育和肿瘤发生至关重要,同时也可通过被动和主动的酶促去甲基化过程被去除。
目前,大多数 DNA 甲基化检测方法存在局限性。亚硫酸氢盐测序技术虽能在碱基分辨率下检测 5mC 和 5hmC,但会破坏 DNA,使初始 DNA 模板损失高达 90%,后续 PCR 步骤还会引入偏差,导致测序覆盖度降低且不均匀。此外,由于 5mC 和 5hmC 都能抵抗亚硫酸氢盐介导的脱氨基作用,要区分它们还需不同处理方法。
氧化亚硫酸氢盐测序(oxBS-seq)和 TET 辅助亚硫酸氢盐测序(TAB-seq)虽可在碱基对分辨率下对 5hmC 进行测序,但存在化学转化效率低、易产生假阴性和假阳性结果等问题,且准确检测 5hmC 往往需要深度测序。基于免疫沉淀的方法可用于基因组规模的 5mC 和 5hmC 测序,但缺乏碱基分辨率,难以区分抗体与未修饰 DNA 的非特异性结合,容易产生假阳性富集峰。
研究方法
研究人员使用了 Oxford Nanopore Technologies 的 PromethION 系统对小鼠小脑的全基因组进行测序,生成了超过 16 亿个碱基的测序数据,涵盖 1230 万个 CpG 二核苷酸位置,并与公开的 oxBS 和 TAB-seq 数据进行对比。同时,使用 MinION 对 5hmC 富集的 hMeDIP 文库进行直接测序,验证碱基检测的敏感性。
他们还运用纳米孔双链测序技术,在印记基因位点和 CTCF 结合位点研究位点水平的修饰对称性。此外,通过对市售的人类 DNA 甲基化标准品(Zymo, D5013)进行测序,评估原始读取检测 5mC 的准确性。在数据处理方面,他们利用开源的 Dorado base-caller(v0.5.1)进行碱基检出,并运用多种工具对数据进行比对、排序、索引和修饰碱基提取。
研究结果
利用原始读数检测 5mC 的准确性:研究人员对市售的人类 DNA 甲基化标准品进行测序,结果显示,5mC 的原始读数准确性非常高,精确度达到 0.99,检出率为 0.97。不过,研究发现纳米孔测序在高 GC 含量区域存在映射错配的问题,GC 含量与假阳性修饰检测率(FPR)呈强相关(r = 0.76;p≥0.001),在高 GC 含量区域,如 Alu 重复序列、卫星重复序列、低复杂性区域、简单重复序列和富含 GC 的 CpG 岛等,错误率较高。此外,在未修饰和甲基化标准品中均存在 5hmC 的假阳性检测,且甲基化标准品中的假阳性率约为未修饰标准品的 5 倍,表明 base-caller 容易将真正的甲基化位置误判为羟甲基化。
与亚硫酸氢盐测序方法的一致性:研究人员对两只 8 周龄雌性小鼠的小脑组织进行测序,并与公开的 oxBS-seq 和 TAB-seq 数据进行比较。结果表明,纳米孔测序和亚硫酸氢盐测序在检测修饰碱基方面具有相似性。两种方法检测到的 CpG 甲基化均呈现双峰分布,5hmC 均呈现单峰分布且集中在 0% 附近。纳米孔测序检测到的 5mC 比例略低于 oxBS-seq,5hmC 比例低于 TAB-seq,这可能分别反映了 oxBS-seq 对甲基化碱基检测的偏向性以及纳米孔测序检测 5hmC 的假阴性误差。同时,研究还发现纳米孔测序的基因组深度更高,且与其他方法一样,GC 含量与测序深度呈负相关。在不同测序深度下,纳米孔测序的 5mC 和 5hmC 检测的实验内变异与 oxBS-seq 和 TAB-seq 相近,且随着测序深度增加,实验内和实验间变异均降低。此外,两种方法在检测不同基因组背景下的 5mC 和 5hmC 修饰模式时表现出一致性,且纳米孔测序和 TAB-seq 检测到的 5hmC 在全基因组范围内的富集模式具有显著相关性。
5hmC 富集文库的直接测序:研究人员对 5hmC 免疫沉淀产物进行纳米孔直接测序,发现通过 MACS2 可识别出平均 4654 个峰,且这些峰在基因元件和启动子区域更为常见。与全基因组测序相比,峰区域内直接检测到的 5hmC 占 CpG 位点胞嘧啶碱基的比例显著更高,5mC 比例则更低。虽然部分序列读取中未检测到 5hmC,但峰检测结果支持了 base-caller 识别 5hmC 富集的敏感性,且该技术与 TAB-seq 对富集的羟甲基化具有相似的敏感性。
双链测序检测 CpG 二联体不对称性:利用高双链纳米孔流动池进行双链测序,研究人员发现全基因组中,双链配对读取平均占序列读取的 32%。在所有 CpG 二联体中,对称修饰状态最为常见,半修饰和异源修饰(如 5mC:5hmC 对)占比较小,5hmC 主要以异源修饰状态存在。在 15 个之前定义的差异甲基化区域(DMR) 中,双链模式与基因组背景存在显著差异,不对称修饰相对较少。此外,研究还发现 5hmC 在印记基因的甲基化和未甲基化等位基因中均有不同的分布模式,为研究印记基因的甲基化动态提供了新视角。
CTCF 结合位点的修饰模式:研究人员以 CTCF 为研究对象,发现其结合位点的 CpG 二联体修饰模式与基因组背景不同。在 CTCF 结合的基序中,对称未甲基化的 CpG 碱基比例显著更高,且二联体修饰状态与距 CTCF ChIP-seq 结合位点的距离存在显著关系。对称未修饰的 C:C 位置在靠近结合位点处更为集中,而其他修饰状态则与距离呈现不同的相关性。此外,虽然不对称甲基化在某些情况下被认为更有利于 CTCF 结合,但在研究数据中,不对称修饰的 CpG 位点在 CTCF 结合位置中占比较小。同时,研究还发现 CTCF 结合位点的方向对环形成很重要,在小鼠中,部分回文 CTCF 基序虽可能实现双向结合,但不对称甲基化并不常见,且与这些基序相关的基因在神经系统、全身和大脑相关功能中显著富集。研究人员推测,回文 CTCF 基序序列的链不对称性可能影响 CTCF 结合的方向,未来可通过纳米孔双链测序结合 HiC 数据对此进行验证。
研究结论与讨论
这项研究表明,纳米孔测序检测 5mC 和 5hmC 的结果与广泛使用的技术一致,为研究这些与疾病、衰老和发育相关的修饰开辟了新途径。通过纳米孔测序,研究人员在印记基因的 DMR 中研究了链修饰对称性和等位基因特异性甲基化,证实了生殖系 DMR 具有较高的甲基化保真度,且发现 5hmC 在所有 DMR 的两个等位基因上均存在,但相对于基因组背景有所减少。此外,纳米孔测序在印记基因位点展现出定量能力,且长读长和直接修饰读数有助于简化单倍型重建,为发现新的印记基因位点和等位基因特异性修饰提供了便利。
在 CTCF 结合位点的研究中,纳米孔双链测序揭示了与基因组背景不同的链修饰对称和不对称模式,进一步证实了 CTCF 结合对未修饰胞嘧啶的偏好。不过,使用双链测序研究不对称 CpG 修饰时存在技术限制,如双链捕获效率仅为中等水平,平均只有 32% 的读取以双链对的形式存在。因此,若要实现双链捕获目标,建议总覆盖度至少为目标双链深度的 6-7 倍。
总体而言,纳米孔测序能够直接、准确地检测 DNA 中胞嘧啶的三种表观遗传状态(C、5mC 和 5hmC),与其他常用技术相比具有诸多优势,可在标准测序过程中实现高通量、直接且准确的修饰状态读取。未来,若能提高双链读取捕获率、改进碱基检测算法以检测 5mC 的后续氧化产物及其他碱基修饰(如 6mA),将为表观遗传学研究带来更大优势,有望实现对 DNA 修饰完整图谱的检测,推动相关领域的深入发展。
知名企业招聘
今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号