第三代测序:单分子测序在基因分型与突变验证中的应用

【字体: 时间:2012年08月10日 来源:

编辑推荐:

  Broad 研究院的科学家们利用PacBio RS系统对千人基因组计划中产生的SNP突变进行基因分型与验证,探讨了PacBio 单分子测序技术在该领域的应用,相关的文章于8月5号在线发表在《BMC Genomics》上。文章显示PacBio平台能够更好的进行基因分型与突变验证,研究人员认为PacBio技术是一种有效的后期验证与重复实验的工具。

Broad 研究院的科学家们利用PacBio RS系统对千人基因组计划中产生的SNP突变进行基因分型与验证,探讨了PacBio 单分子测序技术在该领域的应用,相关的文章于85号在线发表在《BMC Genomics上。

长期以来,二代测序因为片段过短,而容易产生各种假阳性和假阴性的结果,所以对于基因组测序所产生的突变数据一般需要利用其他方法进行交叉验证,以找到真正的突变;目前研究人员对于突变数据的验证一般采用Sequenom质谱、Sanger测序法。虽然这两种方法的准确性很高,能检出大量的假阳性与假阴性结果,但是Sequenom方法对未知位点突变无法进行检测,且很多分析仍然需要借助人工方法,容易产生人工误差。而Sanger测序法通量低、花费大且同样存在人工误差的问题。此外采用多种测序平台进行交叉验证也大大降低了效率,且产生新的突变类型导致更加复杂的分析。所以,*好是利用已有的测序平台直接产生高质量的测序数据,*大程度避免其他方法的交叉验证,大大提高研究效率。

PacBio 单分子测序技术能产生大量的长片段数据,能更好的进行基因组定位,而且能迅速的进行基因组组装,其CCS测序模式能产生比二代测序技术更准确的序列数据,对单分子的直接测序也能*真实的反应原始序列信息,所有的这些特性为PacBio单分子测序技术应用于基因组测序数据分型与验证方面提供了良好的条件。

Broad 研究院的科学家们从千人基因组计划产生的SNP数据中挑选了98个已经用其他方法验证过的难测SNP位点(其中38个是真实位点,60个是假结果),分别利用PacBio平台和Illumina Miseq平台对其进行验证,结果显示,PacBio数据有着更好的准确性和假阳性检出率,相对而言是一种更为有效的验证工具。研究人员也利用这两个平台分别对Hap map中的225SNP位点进行了验证分析,也显示PacBio平台能更有效的发现新的变异,修正参考基因组,研究人员认为PacBio技术是一种有效的后期验证与重复实验的工具。

因为极端的碱基序列组成是许多测序数据错误产生的源头,二代测序平台产生的大多是短序列数据,这些数据在进行基因组定位时更容易发生定位错误,而且依赖PCR过程,不可避免有扩增错误,这些错误是系统性的,很难纠正,使得测序结果错误率较高;而PacBio单分子测序产生的是长片段,能更精准的进行定位,*大限度的降低定位错误,不引入PCR bias,其测序产生的错误都是随机错误,不随片段的延长而增加,可以通过GATK软件进行纠正,所以PacBio平台能有着更好的基因分型与突变验证应用。

相关链接:

Broad InstituteMauricio Carneiro博士 关于PacBio 系统应用于SNP发现或确认领域的视频链接

现场交流:第三代单分子测序 PacBio技术及其应用进展讲座

PacBio碱基修饰分析标识微生物、病原菌的表观遗传学标志

基因组装配新前沿:长片段完成完整的基因组

新技术攻克单分子测序大问题

更多信息请见原文:

Pacific biosciences sequencing technology for genotyping and variation discovery in human data

Mauricio O Carneiro Carsten RussMichael G Ross Stacey GabrielChad Nusbaum Mark A DePristo

BMC Genomics 2012, 13:375      doi:10.1186/1471-2164-13-375

Abstract

Background

Pacific  Biosciences  technology  provides  a  fundamentally  new  data  type  that  provides  the potential  to  overcome  some  limitations  of  current  next  generation  sequencing  platforms  by providing significantly longer reads, single molecule sequencing, low composition bias and an error profile that is orthogonal to other platforms. With these potential advantages in mind, we  here  evaluate  the  utility  of  the  Pacific  Biosciences  RS  platform  for  human  medical amplicon resequencing projects.

Results

We evaluated the Pacific Biosciences technology for SNP discovery in medical resequencing projects  using  the  Genome  Analysis  Toolkit,  observing  high  sensitivity  and  specificity  for calling  differences  in  amplicons  containing  known  true  or  false  SNPs.  We  assessed  data quality: most errors were indels (~14 %) with few apparent miscalls (~1 %). In this work, we define  a  custom  data  processing  pipeline  for  Pacific  Biosciences  data  for  human  data analysis.

Conclusion

Critically,  the  error  properties  were  largely  free  of  the  context-specific  effects  that  affect other sequencing technologies. These data show excellent utility for follow-up validation and extension studies in human data and medical genetics projects, but can be extended to other organisms with a reference genome.

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号