2014创新产品:PacBio测序仪,岂止于长

【字体: 时间:2015年02月06日 来源:生物通

编辑推荐:

  Pacific Biosciences公司的测序仪虽说之前也上过榜,但这一次,它再度升级了测序聚合酶和化学染料(P6-C4),让PacBio测序仪的平均读取长度提高到10,000 bp或者更长。这不仅仅是数字上的增加,也带来了二代测序无法实现的应用。2014年,PacBio技术发表在多个重要期刊上,而仪器销量也节节攀升,这体现了它的价值正为更多人所认可。

过去6年,生物通一直在追踪生命科学领域最前沿的创新产品,将其介绍给大家。2014年,生物通继续搜罗新上市的产品,为大家奉上一场技术盛宴。经过一个半月的网页和微信投票以及专家评鉴,2014生命科学十大创新产品终于出炉。

Pacific Biosciences公司的测序仪虽说之前也上过榜,但这一次,它再度升级了测序聚合酶和化学染料(P6-C4),让PacBio测序仪的平均读取长度提高到10,000 bp或者更长,有>50%的序列长度都超过了14,000 bp,最长读长甚至超过40,000 bp。这不仅仅是数字上的增加,也带来了二代测序无法实现的应用。2014年,PacBio技术发表在多个重要期刊上,而仪器销量也节节攀升,这体现了它的价值正为更多人所认可。

如此看来,PacBio测序仪被评为2014生命科学创新产品,也是理所当然的。为了让大家更好地了解这一产品,生物通采访了PacBio中国地区代理商 – 基因有限公司的技术专家。

Q:PacBio今年的升级主要体现在哪些性能的改善?这具有什么意义?

A:2014年10月下旬,目前市面上唯一的第三代测序设备供应商Pacific Biosciences再度升级了测序聚合酶和化学染料试剂(P6-C4),进一步增加了其原本就傲视群雄的序列读取长度,N50超过了14 kb,这无疑是测序届爆发的又一枚超级炸弹。

P6-C4试剂可以将PacBio的平均读取长度提高到10,000 bp或者更长,有>50%的序列长度都超过了14,000bp,最长读长> 40,000bp,在业界遥遥领先。并且,通量上也有了进一步的提高,升级后每个SMRT Cell的有效数据产出量高达500 Mb-1 Gb。这种性能的提高,其中一部分原因是PacBio在原有C3试剂的光保护染料(photo-protected dyes of the C3 chemistry)基础上进行了升级,新的化学试剂同时结合了C2的精确度与C3的读取长度两种优点。PacBio建议用户采用新的化学试剂来实现所有基于PacBio测序仪的相关应用。

本次升级同时发布的还有新的软件SMRT® Analysis v2.3。软件包括改进的长扩增子分析,Iso-Seq™应用,Quiver以及CCS,同时还有性能的提升。这些更新进一步增强了结果的准确度,加快了分析速度,并且为混合的各种大小的扩增子分析如全长HLA Class I 和Class II 基因提供了更多的选择。

关于P6-C4试剂的具体表现,美国最好的植物科学研究中心---密苏里州Danforth植物科学中心的Robert Van Buren于2015年1月10日-14日在美国圣地亚哥举办的第23届国际动植物基因组大会上做了介绍。他采用PacBio P6-C4试剂对基因组非常复杂的黍草进行De novo Assembly,做了65×的测序深度,用了23个SMRT Cells,得到了18 Gb的数据,平均读长为12.872 kb,N50为16.485 kb,该植物的端粒区含有长度为5-10 kb的TTTAGGG重复,PacBio帮助他们成功地跨越了该区域。

除了长读长在动植物领域带来的重大改善,越来越多的基因组测序中心也开始关注于人类的疾病基因组测序,需要产生"Medical Grade Information“,也就是医学级数据,二代测序受制于其技术原理,很多情况下,无法得到准确的定位和定量序列信息,信息并不完整,垃圾数据含量过大,一些基因的结构异常,如多达几百bp甚至更长的重复序列tandem repeat,大片段的易位translocation,二代测序都无法发现,这些都是无法通过加深测序深度及生物信息学分析进行弥补的。而测序读长长,就可以解决在二代测序视野中无法解决的此类问题。

More Than Longer,岂止于长。

Q:PacBio今年发表了不少好文章,是否能挑选有代表性的文章给大家介绍一下?

A:不得不提的一篇文章来发表在2014年11月10日的《自然》(Nature)杂志上。该文利用PacBio单分子实时测序测序技术,揭示出了人类基因组中成千上万从未见过的遗传变异。这些研究发现关闭了长期以来因无法测序造成的许多人类基因组作图缺口,这一发现被业界评论为首次构建了白金人类基因组!

领导这一研究小组的是华盛顿大学基因组学系教授、霍华德•休斯医学研究所研究员、弗雷德•哈钦森癌症研究中心人类生物学部兼职教授Evan Eichler博士,其主要从事于基因组学与生物信息学研究,是国际上进行人和其他灵长类动物比较功能基因组学与生物信息学研究的顶尖科学家。在Cell、Nature、Science等国际顶尖学术期刊上发表了具有重要影响力的论文260多篇。

了解PacBio单分子测序仪的更多应用

Eichler说:“长期以来科学家们对许多疾病的遗传病因都感到困惑不解。这一称作为单分子、实时DNA测序(SMRT)的新技术,使得研究人员现在鉴别出这些疾病背后的潜在遗传突变成为了可能。现在,我们进入到了以往对我们来说不透明的一个遗传变异的全新领域。”到目前为止,科学家们还只能确定大约一半遗传性疾病的遗传病因。尽管无数科研人员在经年累月地进行研究,但人们还是未能找到许多人类疾病和特征背后的遗传因素,例如身高等家族特征和二型糖尿病患病风险。这一谜题被称为“遗传性缺失”(missing heritability)。导致这一问题的一个原因在于,标准的基因组测序技术无法精确绘制基因组许多组成区域的图谱。这些方法是通过排列通常大约为100个碱基长度的、亿万的重叠的DNA小片段,随后分析它们的DNA序列来构建基因组图谱。这种方法已成功绘出了数百万人类基因组中的小变异。这些由单核苷酸碱基替换引起的变异,称作为单核苷酸多态(SNP)。但由于一些技术原因,以往科学家们无法可靠地检测出长度在大约50-5000个碱基之间的变异。

新研究中所采用的这一SMRT技术使得测序和读取长度超过5000个碱基的DNA片段成为可能,比标准的基因测序技术还要长。这一由Pacific Biosciences开发的“长读长”技术,使得研究人员能够构建出相比以往更高分辨率的基因组结构变异图谱。研究的主要作者、Eichler实验室博士后Mark Chaisson开发出了这种方法,使得利用这一数据以碱基对分辨率来检测结构变异成为了可能。为了简化他们的分析,研究人员利用了来自葡萄胎(hydatidiform mole)的基因组。葡萄胎是由精子与缺乏母源DNA的卵子受精所导致的一种异常生长物。葡萄胎的基因组织只包含每个基因的一个拷贝,而非存在于正常细胞中的两个拷贝,简化了搜寻遗传变异。在葡萄胎中应用这一新方法,研究人员鉴别并测序了与基因组研究中标准人类参考基因组不同的26,079个片段。

Eichler说,其中大多数的变异(大约22,000个)从未被报道。“这些研究结果表明,我们错失了很多的变异。”这一技术还使得Eichler和同事们绘制出了160个基因组片段的图谱,在过去一直难以对这些称作为常染色体缺口(euchromatic gaps)的片段进行测序。他们的努力关闭了50个这样的缺口,缩小了其他40个缺口。这些缺口包括一些重要的序列,一些基因的组成序列以及帮助控制基因表达的一些调控元件。在这些缺口中的一些DNA片段显示出已知对大肠杆菌有毒的标记。大肠杆菌是常用于一些基因组测序过程的一种细菌。如果将这样的DNA序列置于大肠杆菌中,有可能细菌会删除这一DNA。”这或许可以解释为什么不能采用标准方法来对其进行测序。他补充说:“这些缺口还携带了采用标准的测序方法无法很好复制的复杂序列。这些序列在人与人之间存在着广泛的差异,它们有可能是一些遗传不稳定性热区。”

Eichler预测:“在五年内,会有一种长读长测序技术将使得临床实验室能够从一端到另一端测序患者的染色体。‘是的,你具有大约3百万-4百万的SNPs以及插入缺失,你还具有大约3万-4万个结构变异。在其中,有一些结构性变异和少数的SNPs是你易患某种疾病的原因。’知道所有这些突变将改变游戏的规则。”

Q:PacBio在2015年预计还会有哪些改进?

A:2015年,PacBio公司计划将其测序通量提高4倍,进一步提高测序reads长度,增加样品制备操作手册及多个数据分析的应用程序。总结起来就是更高(通量)、更长(读长)、更快(分析)。而这一切的升级均来自于试剂耗材,用户无需更换现有仪器。

近日,该公司首席科学官Jonas Korlach在官网上发表博客表示,PacBio公司计划提高PacBio RS II测序平台的通量,使每SMRT cell一次运行可输出超过4 Gb数据,平均读取长度增加到15-20 kb。去年秋天该公司升级了测序聚合酶和化学染料(P6-C4),使每个SMRT Cell 数据输出量从0.5G提升到1GB,平均读长达到10-15KB。最初的PacBio RS II平台,一天运行16个SMRT Cell只能产生6.4G的原始数据。PacBio公司计划通过提升化学试剂,操作流程及软件来提高测序质量。包括将单一聚合酶加载到芯片上,从而提高装载效率。

此外,该公司计划提升样本制备流程并将其简单化,为混合样本添加条形码,发布长插入片段和全长cDNA文库的操作手册。在数据分析方面,PacBio公司计划与生物信息学团队合作开发更快的de novo组装基因组的算法,进一步开发Falcon assembler及其他软件来解决二倍体或多倍体基因组的分析工作,简化全长转录本测序、Iso-Seq™全长转录本/异构体测序以及人类白细胞抗原(HLA)单体型定相的工作流程。

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号