-
生物通官微
陪你抓住生命科技
跳动的脉搏
精准长读长 HiFi 测序以单分子分辨率揭示嵌合变异对染色质可及性和表观遗传的影响
【字体: 大 中 小 】 时间:2024年12月24日 来源:基因有限公司
编辑推荐:
Targeted Fiber-seq技术是一种高分辨率的染色质分析方法,可以在单分子水平上同时分析染色质的基因组序列、表观遗传标记(如CpG甲基化)和染色质可及性,可以精准地揭示染色质的结构变化和基因表达的调控方式。
Fiber-seq
染色质是DNA与组蛋白和非组蛋白结合形成的动态复合体,它的三维结构直接影响基因表达、基因组稳定性和细胞功能。然而,染色质结构是高度复杂且动态的,这对研究其结构与功能之间的关系提出了诸多挑战。准确量化非编码嵌合变异的功能需要将DNA序列与单个DNA分子上的可及和封闭的染色质结构配对,而这种配对是无法使用传统的基于碎片的染色质分析实现的。随着单分子测序技术的发展,长读长测序(如PacBio的三代测序平台)成为研究基因组与表观遗传学的有力工具。长读长测序可以提供大规模的基因组信息,同时为研究复杂的基因组结构(如重复序列、插入和缺失等)带来了新的可能性。
Targeted Fiber-seq技术是一种高分辨率的染色质分析方法,可以在单分子水平上同时分析染色质的基因组序列、表观遗传标记(如CpG甲基化)和染色质可及性,可以精准地揭示染色质的结构变化和基因表达的调控方式。
实际应用
2024年7月,bioRxiv上发表了一篇名为Resolving the chromatin impact of mosaic variants with targeted Fiber-seq的文章。这篇文章主要探讨了嵌合变异(mosaic variants)对染色质结构和功能的影响,特别是在基因组中的多样性如何影响细胞内的染色质构型。为了克服现有方法在研究嵌合体突变时面临的挑战,研究人员使用了Targeted Fiber-seq,并应用该技术揭示了嵌合体突变如何影响染色质的调控。通过这一创新方法,研究者能够更准确地解析嵌合体突变对染色质影响的具体机制。
Part 1
Targeted Fiber-seq实验流程如图1a所示:研究人员提取细胞核酸后,使用m6A-MTase处理并标记染色质中的开放区。随后使用CRISPR/Cas9技术获得靶向核酸大片段,通过SAGE-HLS进行大片段回收。最后将核酸片段打断成10-15kb的片段,在保留修饰信息的前提下,使用PacBio进行测序。为了验证方法学上的可行性,研究人员首先将Targeted Fiber-seq应用于培养的淋巴母细胞(GM04820)。在所有三个目标位点上实现了101-164倍的中位覆盖度(图1b、c),与全基因组方法相比,相当于约20倍的富集(图 1d,方法)。在所有样本中获得了10倍的中位富集率(图 1e)。同时,全面、深度覆盖的表观遗传图谱揭示了单个染色质纤维的染色质结构中存在明显的异质性(图1f)。研究人员验证了在单分子水平上精确捕获和分析染色质上的表观遗传修饰。这对于开发新的基因组编辑和表观遗传学研究工具具有重要意义。
图1. Targeted Fiber-seq方法。a) 方案示意图。b) 显示在靶向基因座上的 Fiber-seq 百分比驱动(红色)、ENCODE DNase I-seq(蓝色)和每个碱基的靶向 fiber-seq 覆盖率。c) 与非靶向区域 (chr14:20283833-20402650, hg38) 相比,靶向区域每个碱基覆盖率的小提琴图。d) 相对于 WGS 的靶向基因座的相对富集 (方法)。e) 所有样本和目标的相对富集。f) 放大说明性基因座,显示单个纤维中的 m6A 事件(紫色刻度)。
Part 2
紧接着,研究人员应用Targeted Fiber-seq技术分析肌强直性营养不良症1型(Myotonic Dystrophy Type 1, DM1)相关的DMPK基因的CTG重复扩增对染色质结构、CpG甲基化以及染色质可及性的影响。DMPK基因CTG重复扩增是DM1的病理特征,这种重复会引起染色质结构和基因表达调控的异常。研究人员首先对来自DM1家族中四名有症状个体的成纤维细胞中的DMPK基因座进行靶向富集。借助Fiber-seq研究人员量化了具有单分子分辨率的的CTG重复扩增不稳定性,如图2a/b所示。三代个体间的差异说明了该变异的体细胞不稳定性。接下来,研究人员利用底层高度准确的测序信息对160 kb目标区域内的每个供体的单倍型相位进行分析,从而确定它是来自含有正常或致病性重复扩增的染色质纤维,如图2c。利用每条纤维上的成对 Fiber-seq 染色质结构,观察到假定的 SIX5增强子被1kb超CpG甲基化区域包围,并且染色质可及性在第二代和第三代的重复扩增单倍型中被大大削弱。该结果表明致病性 DMPK重复扩增通过上游CpG甲基化和染色质可及性的局部改变破坏染色质,并暗示这种上游增强子样元件是SIX5的增强子。
图2. DM1成纤维细胞中DMPK 3’ UTR CTG 扩增处单倍型解析的染色质可及性和 CpG 甲基化。a)代表成纤维细胞供体的家族谱系。每个形状内的标签分别代表致病和正常等位基因内的 CTG 拷贝数。b)完全跨越 CTG 重复的测序读数中的 CTG 计数,按单倍型分组。c) 通过浏览器轨迹图比较了正常等位基因与病理性等位基因(来自第一、二、三代)的染色质结构。图中展示了CpG甲基化水平的差异(黄色至红色表示p值从0.01到0.0001),以及正常(浅蓝色)、第二代/第三代扩增(红色)和第一代扩增(绿色)等位基因的染色质可及性百分比。d) CTG 相邻 CTCF 结合位点的 CTCF 足迹。如果足迹与甲基化敏感斑块完全重叠,则将其归类为可及的,如果可及的足迹不包含任何m6A,则将其归类为 CTCF 结合。e) 展示了在正常和扩增纤维之间,每个可及峰值的染色质激活差异。x轴表示激活差异,y轴表示p值。图中的绿色和红色点分别代表第一代和第二/三代的比较结果。f) 在 e 中描述的峰值处绘制 CpG 甲基化差异与染色质驱动差异的关系图。
Part 3
同时,研究人员应用Targeted Fiber-seq技术研究在HBG1/HBG2启动子中通过碱基编辑(ABE)引入特定突变后对染色质可及性和CpG甲基化的影响。该部分中作者提出,他们对HBG1和HBG2启动子的碱基编辑如何影响胎儿γ珠蛋白表达的机制理解受到了挑战。因为碱基编辑通常是不完整的,这导致细胞群体中编辑和未编辑的单倍型的混合,并且HBG1和HBG2基因位于高度相似的节段重复内,在近端启动子上具有 100% 的序列同一性,短读长测序方式会限制对该区域进行差异化分析。
作者利用ABE将HBG1和HBG2启动子中的BCL11A结合位点突变(A>G)。再将编辑后的CD34+造血干细胞分化为红细胞,进行Fiber-seq分析。研究发现,BCL11A结合位点突变后,HBG1和HBG2启动子的染色质开放性显著提高(>100%)。同时,启动子区域的CpG甲基化水平降低,进而重新激活了胎儿血红蛋白的表达,为心源性猝死和β地中海贫血的治疗提供了表观遗传调控的新策略。如图3所示。
图3. HBG1/HBG2启动子内的BCL11A元素的治疗性碱基编辑。a) 实验范例示意图。b) 序列标识显示 HBG1和HBG2启动子中 BCL11A 结合位点内的碱基编辑。字母高度对应于相对碱基频率。c) HBG1 和 HBG2(黄色)、仅 HBG1(深灰色)、仅 HBG2(浅灰色)和两者都没有(蓝色)的 BCL11A 位点被编辑的纤维百分比。前三个类别在 d 中分组为“已编辑”读取。d) ABE 编辑的 CD34+ 衍生红细胞的 UCSC 浏览器轨迹。(顶部)在目标区域内的所有纤维映射中,比较处理的多能祖细胞的 ENCODE DNase-seq(蓝色)和 CD34+ 衍生红细胞的染色质可及性(Fiber-seq FIRE)。(底部)放大并比较 HBG1 和 HBG2 中已编辑和未编辑的纤维。比较了 CpG 甲基化的差异,以及未编辑纤维(蓝色)和 HBG1 和/或 HBG2 编辑纤维(粉色)的驱动百分比。底部显示了编辑读取的峰值调用和每个峰值的诱导百分比。
总体而言,文章证明,Targeted Fiber-seq能够生成靶向长读长测序染色质图谱,从而以单分子精度解决遗传和染色质结构的异质性。重要的是,由于Targeted Fiber-seq能够同步测量同一DNA分子序列(≥10kb)、CpG甲基化和染色质可及性,我们可以直接解开不同类型的遗传变异对邻近基因调控程序的功能影响。将其应用于DMPK和HBG1/HBG2基因座表明,精确的遗传变异可能导致染色质可及性的复杂改变。与此同时,研究人员强调短读长测序方法不适合识别可能因变异而改变的邻近调控元件,因为读长通常小于150bp,从而导致对嵌合体变异如何影响基因调控结构的看法过于短视。
PacBio精准长读长HiFi测序是实现Targeted Fiber-seq的关键工具,其独特的技术优势为研究染色质结构和表观遗传特征提供了强大支持。精准长读长测序能力为研究重复序列扩增和复杂区域(如基因组插入/缺失)的结构变异提供了强有力的技术支持。单分子分辨率使研究人员能够同时获得基因组序列、表观遗传修饰和染色质结构的多维信息,为理解嵌合突变如何影响染色质功能提供了精确工具。高覆盖度增强了Fiber-seq在检测低频嵌合突变和复杂区域的可靠性,为准确研究这些变异的功能效应奠定了基础。
基因有限公司作为PacBio公司中国区合作伙伴,自2011年以来将PacBio第三代单分子实时测序技术引入国内,一直为国内用户提供专业的三代测序系统的安装培训,技术支持,应用培训与售后维护工作,赢得客户的一致好评与信任。基因有限公司将一如既往的支持越来越多的PacBio用户。
如果您想了解更多,请扫码联系我们的工作人员吧~
关于基因
基因有限公司成立于1992年,是一家提供生命科学科研仪器、试剂耗材和技术服务的综合服务商。基于“Gene Brightens Every Life • BioTech Connects the World”——“基因燃亮生命 • 生物技术连接世界”的愿景,专注于生命科学领域前沿技术的引进和推广,致力于推动该领域国内科研机构硬件水平及实验方案的革新与升级。同时,公司也一直致力于自主品牌的科研设备的研发与生产,拥有一系列通用性强、互补性高的自主品牌产品。
基因的服务网络遍及全国各地十多个大中城市,拥有包括仪器销售,试剂销售,市场与技术支持,维修,客服,物流等多个部门组成的完整服务体系。
我们希望通过不懈努力,为您的成功铺路搭桥,也为中国的生命科学事业赶超世界先进水平尽一己之力。欲了解更多信息,请访问www.genecompany.cn。