-
生物通官微
陪你抓住生命科技
跳动的脉搏
澄清那些对 PacBio HiFi 测序的误解——关于人类基因组
【字体: 大 中 小 】 时间:2024年07月23日 来源:基因有限公司
编辑推荐:
长读长测序不仅是基因组学巨头们的专利,它也适用于您个人对人类基因组的研究工作。因此,让我们澄清有关长读长测序的误解,并了解它如何融入您的研究难题。
2003年,人类基因组计划宣告完成,这一壮举引起世界轰动,然而实际上当时只有92%的人类基因组被绘制出来。2022年,得益于HiFi测序技术的出现,剩余的8%的人类基因组被破译,人类基因组首次完成了“从端粒到端粒”的完整组装。这样的成就似乎超出了日常研究的范围,只能留给预算与之相匹配的庞大健康项目。但事实是,长读长测序不仅是基因组学巨头们的专利,它也适用于您个人对人类基因组的研究工作。因此,让我们澄清有关长读长测序的误解,并了解它如何融入您的研究难题。
误区1:
高度准确度的HiFi 长读长对于临床和转化研究来说是不必要的。短读长测序数据质量足以满足变异检测和基因表达的需求。
事实:
这种说法是短视的。
研究人员明白,准确性对于所有科学领域都至关重要。在临床或转化研究背景下,风险甚至更高。不准确的结果可能意味着遗漏了可能影响生存的潜在的疾病致病原因。
长读测序提供了显著优于短读长测序的基因组和转录组视图。其优势是巨大的:长读长提供了更全面的视角,捕捉了全部范围的基因信息。这包括定相(phasing)、甲基化模式以及捕获以前无法企及的基因组暗区。
对于人类基因组,与传统的短读长测序方法相比,长读长测序揭示了更多的变异信息,可以识别出更多小的变异(SNPs, InDels)和更多结构变异(SVs)。包括检测串联重复序列内的变异,并揭示基因组中难以捕捉的8%的“暗区”。此外,长读长测序可以实现变异的单倍型定相,通过将甲基化模式与遗传变异联系起来,提供更清晰的遗传蓝图。
对于转录组,长读长测序提供了卓越的深度分析,揭示了异构体库的完整视图。它能够准确表征剪接体和融合转录本,从而更全面地了解短读长测序可能遗漏的基因表达和调控机制。通过长读长测序,研究人员可以探索异构体使用的变化如何导致健康和疾病之间的表型差异。
HiFi测序准确度至上。即便在基因组的“黑暗”区域,例如富含GC或重复的区域,它也能提供高准确度。与需要额外步骤对基因组进行定相的短读长测序技术不同,HiFi测序能够检出和定相小的变异及大的变异,为研究人员提供对疾病研究至关重要的单倍型信息。
图1:短读WGS和HiFi WGS对变异检测的比较。
误区2:
PacBio HiFi测序对于大型项目来说太昂贵了。
事实:
这种说法已经过时了。
进行HiFi测序的成本已经不是几年前的水平了。现在,从样品制备到文库制备和测序,工作流程变得更加简单和经济。随着Revio系统的推出,长读长测序变得更加实惠且易于使用,在Revio上实现30×覆盖度的单个人全基因组测序,成本大幅降低。
由于高准确度的HiFi reads可以生成更全面的基因组图谱,因此 HiFi 测序使研究人员能够通过一次检测更快地了解疾病背后的遗传原因。相比之下,短读长测序的工作流程需要多项检测才能得出答案,浪费了宝贵的时间和资源。
大型项目,如美国国立卫生研究院(National Institutes of Health)开展的“All of Us Research Program”,已经认识到,即使在覆盖率较低的情况下(10-15×),HiFi测序也能提供更多的信息,并且通常超过了短读长测序的准确性。这种方法通过进一步降低成本体现了长读长的优势。
在一项名为“Utility of long-read sequencing for All of Us”的研究中,作者指出,“HiFi测序对小的变异和大的型变异都产生了最准确的结果。
Mahmoud等人在2023年发表的文章中也提到 “长读长测序在为All of Us以及许多其他项目建立最完整、最准确的变异检测发挥了广泛的价值”。
误区3:
PacBio HiFi测序无法扩大规模以开展大型项目或满足繁忙的核心设施平台或服务商的需求。
事实:
这种说法是错误的。
对于爱沙尼亚国家生物样本库、All of Us 项目、Children's Mercy Hospital 和许多其他机构来说,PacBio HiFi 测序非常适合大规模研究,以获得疾病研究急需的答案。爱沙尼亚国家生物样本库已经购买了三套Revio系统,使他们能够在未来两年半内实现10,000个基因组测序的目标。
经验证的自动化合作伙伴、高通量文库制备解决方案和 PacBio兼容的实验流程可为您的大规模操作提供更高的效率。通过针对不同应用的灵活的混样策略,您可以在单张SMRT芯片上运行多个样品。这为大批量项目提供了规模化以及每个样本更具成本效益的选择。它提供了多组学研究的能力,可以灵活地规划同时实现4项应用,这意味着您可以在一次测序中获得基因组、转录组、扩增子和单细胞 RNA 数据。
误区4:
对于大规模应用程序来说,HiFi 工作流程太慢且繁琐。
事实:
这种说法是错误的。
现如今,在Revio系统上实现HiFi测序比以往任何时候都更容易。使用全新的 HiFi Prep Kit 96,您可以更快地、更经济实惠地完成您的人类基因组学项目。与标准 SMRTbell制备方法相比,该试剂盒可将文库制备时间缩短60%。通过自动化,您现在可以在短短13小时内制备96个用于长读测序的文库。
而且,扩展的不仅仅是前期准备工作。我们还提供自动样本分析以及 PacBio WGS Variant Pipeline等生物信息学分析方法,使您能够最大限度地利用测序前、测序间和测序后的时间。
该软件的Pipeline使研究人员能够解析许多不同的变异类型,包括单核苷酸多态性、插入和缺失、结构变异、串联重复、片段重复和拷贝数变异,此外还提供甲基化和定相数据,所有这些都集合在一个生物信息学解决方案中,使其成为最完整的人类WGS二级分析方法。单个计算工作流程将PacBio和第三方工具(包括TRGT、Paraphase和Google DeepVariant)集成在直观的用户界面中。
此外,PacBio分析合作伙伴以及社区支持分析工具,也让HiFi测序新手更容易入门。
误区5:
HiFi长读长测序仅适用于全基因组。
事实:
这种说法是不准确的。
不可否认,基因组提供了广泛和强大视角的信息,但它们可能不是每个项目的主要关注点。您可能正在考虑通过转录组的详细见解来增强您的基因组数据,这正是Kinnex异构体检测发挥作用的地方,它提供了更清晰的RNA序列视图。或者,您的兴趣可能倾向于靶向测序,尤其是如果您的目标是更深入地覆盖临床相关基因或希望阐明基因组中更难以捕捉的“不可映射”区域。
对于研究人类疾病的研究人员,PacBio提供PureTarget repeat expansion panel,这是一组临床相关基因,可提供无扩增、无偏好的靶向测序。PureTarget 文库由天然形式的DNA组成,包括表观遗传标记信息。使用这种PCR-free的方法制备的文库不存在PCR扩增过程中可能引入的错误和噪音。
用于捕获重复扩增的传统工作流程可能包括费力的Southern杂交或多重重复-引物的PCR检测,这些方法可能具有很高的失败率,需要实验室重做样品。PureTarget 提供了一个更精简、更强大的用于捕获关键的重复扩增的解决方案。凭借不到3天时间的便捷的端到端工作流程(包括分析),PureTarget 能够以更有效的方式全面捕获临床相关重复序列。
无论您是深入开展全面的基因组测序、详细的转录组分析,还是侧重靶向测序,您都可以用HiFi灵活地安排一个符合您科学探索的项目。
PacBio高准确度的HiFi reads已然不是昨日(甚至2003年)的长读长测序。HiFi全基因组和多组学数据有可能取代传统的短读长测序,用于人类疾病研究,引领更光明的明天。
您准备好尝试HiFi测序了吗?请联系基因有限公司的工作人员吧!
基因有限公司作为PacBio公司的中国区合作伙伴,自2011年以来将PacBio第三代单分子实时测序技术引入国内,一直为国内用户提供专业的三代测序系统的安装培训,技术支持,应用培训与售后维护工作,赢得客户的一致好评与信任。基因有限公司将一如既往的支持越来越多的PacBio用户。