-
生物通官微
陪你抓住生命科技
跳动的脉搏
第三代测序:单分子测序在基因分型与突变验证中的应用
【字体: 大 中 小 】 时间:2012年08月10日 来源:
编辑推荐:
Broad 研究院的科学家们利用PacBio RS系统对千人基因组计划中产生的SNP突变进行基因分型与验证,探讨了PacBio 单分子测序技术在该领域的应用,相关的文章于8月5号在线发表在《BMC Genomics》上。文章显示PacBio平台能够更好的进行基因分型与突变验证,研究人员认为PacBio技术是一种有效的后期验证与重复实验的工具。
Broad 研究院的科学家们利用PacBio RS系统对千人基因组计划中产生的SNP突变进行基因分型与验证,探讨了PacBio 单分子测序技术在该领域的应用,相关的文章于8月5号在线发表在《BMC Genomics》上。
长期以来,二代测序因为片段过短,而容易产生各种假阳性和假阴性的结果,所以对于基因组测序所产生的突变数据一般需要利用其他方法进行交叉验证,以找到真正的突变;目前研究人员对于突变数据的验证一般采用Sequenom质谱、Sanger测序法。虽然这两种方法的准确性很高,能检出大量的假阳性与假阴性结果,但是Sequenom方法对未知位点突变无法进行检测,且很多分析仍然需要借助人工方法,容易产生人工误差。而Sanger测序法通量低、花费大且同样存在人工误差的问题。此外采用多种测序平台进行交叉验证也大大降低了效率,且产生新的突变类型导致更加复杂的分析。所以,*好是利用已有的测序平台直接产生高质量的测序数据,*大程度避免其他方法的交叉验证,大大提高研究效率。
PacBio 单分子测序技术能产生大量的长片段数据,能更好的进行基因组定位,而且能迅速的进行基因组组装,其CCS测序模式能产生比二代测序技术更准确的序列数据,对单分子的直接测序也能*真实的反应原始序列信息,所有的这些特性为PacBio单分子测序技术应用于基因组测序数据分型与验证方面提供了良好的条件。
Broad 研究院的科学家们从千人基因组计划产生的SNP数据中挑选了98个已经用其他方法验证过的难测SNP位点(其中38个是真实位点,60个是假结果),分别利用PacBio平台和Illumina Miseq平台对其进行验证,结果显示,PacBio数据有着更好的准确性和假阳性检出率,相对而言是一种更为有效的验证工具。研究人员也利用这两个平台分别对Hap map中的225个SNP位点进行了验证分析,也显示PacBio平台能更有效的发现新的变异,修正参考基因组,研究人员认为PacBio技术是一种有效的后期验证与重复实验的工具。
因为极端的碱基序列组成是许多测序数据错误产生的源头,二代测序平台产生的大多是短序列数据,这些数据在进行基因组定位时更容易发生定位错误,而且依赖PCR过程,不可避免有扩增错误,这些错误是系统性的,很难纠正,使得测序结果错误率较高;而PacBio单分子测序产生的是长片段,能更精准的进行定位,*大限度的降低定位错误,不引入PCR bias,其测序产生的错误都是随机错误,不随片段的延长而增加,可以通过GATK软件进行纠正,所以PacBio平台能有着更好的基因分型与突变验证应用。
相关链接:
Broad Institute的Mauricio Carneiro博士 关于PacBio 系统应用于SNP发现或确认领域的视频链接
现场交流:第三代单分子测序 PacBio技术及其应用进展讲座
更多信息请见原文:
Pacific biosciences sequencing technology for genotyping and variation discovery in human data
Mauricio O Carneiro ,Carsten Russ,Michael G Ross ,Stacey Gabriel,Chad Nusbaum ,Mark A DePristo
BMC Genomics 2012, 13:375 doi:10.1186/1471-2164-13-375
Abstract
Background
Pacific Biosciences technology provides a fundamentally new data type that provides the potential to overcome some limitations of current next generation sequencing platforms by providing significantly longer reads, single molecule sequencing, low composition bias and an error profile that is orthogonal to other platforms. With these potential advantages in mind, we here evaluate the utility of the Pacific Biosciences RS platform for human medical amplicon resequencing projects.
Results
We evaluated the Pacific Biosciences technology for SNP discovery in medical resequencing projects using the Genome Analysis Toolkit, observing high sensitivity and specificity for calling differences in amplicons containing known true or false SNPs. We assessed data quality: most errors were indels (~14 %) with few apparent miscalls (~1 %). In this work, we define a custom data processing pipeline for Pacific Biosciences data for human data analysis.
Conclusion
Critically, the error properties were largely free of the context-specific effects that affect other sequencing technologies. These data show excellent utility for follow-up validation and extension studies in human data and medical genetics projects, but can be extended to other organisms with a reference genome.