-
生物通官微
陪你抓住生命科技
跳动的脉搏
外显子组测序的关键——质量
【字体: 大 中 小 】 时间:2013年06月21日 来源:千年基因
编辑推荐:
外显子组仅占全基因组序列的1%左右,却包括大多数与疾病相关的变异,近年来外显子组测序已广泛应用于孟德尔遗传病致病基因的挖掘和癌症等复杂疾病易感基因的研究。与全基因组测序相比,外显子组测序不仅经济高效,数据阐释也更简单;与全基因组关联分析相比,外显子组测序可鉴定低频和罕见变异,结果分析更准确。
外显子组仅占全基因组序列的1%左右,却包括大多数与疾病相关的变异,近年来外显子组测序已广泛应用于孟德尔遗传病致病基因的挖掘和癌症等复杂疾病易感基因的研究。与全基因组测序相比,外显子组测序不仅经济高效,数据阐释也更简单;与全基因组关联分析相比,外显子组测序可鉴定低频和罕见变异,结果分析更准确。
1、 测序质量的重要性
高通量测序的数据质量是信息分析和实验验证的基础,其准确性将直接影响实验结果的可靠性、项目的完成时间及科研成果的及时发布。外显子组研究的目的是在全外显子组范围内进行疾病相关变异的检测,低质量的测序数据将引起假阳性和假阴性变异。假阳性的检测结果将导致候选的变异位点数量过多,大幅增加后期验证及功能研究实验的工作量。假阴性的检测结果将导致有价值的相关变异信息的遗漏,无法达到实验目的。
2、测序质量的评估标准
目前国际上尚无约束测序质量的严格标准,但随着外显子组测序的广泛应用,在质量方面已有一些约定俗成的认可原则。作为国内最高测序质量的提供者,千年基因将为您解析质量评估标准。
首先,碱基质量值是衡量测序质量的重要指标,质量值(Q)越高代表碱基被测错的概率(P)越小,其计算公式为Q=-10lgP。例如,Q20和Q30分别代表碱基被测错的概率为1%和1‰。Illumina官方一般以Q30作为评价标准,以目前最常用的HiSeq 2000平台2×100PE测序为例,Illumina官方保证大于80%碱基准确度达Q30,而千年基因在合同中严格保证大于85%碱基准确度达Q30。
在后期信息分析时数据的选择方面,变异检测时单条read检测出的变异信息很可能由测序错误导致,可靠性较低,因此通常选取覆盖深度大于10×的reads进行分析。目前已发表的外显子组文章中约80%-90%的外显子区域覆盖度达到10×以上,千年基因90%以上的外显子区域覆盖度达到10×以上,保证最高的测序均一性。
Duplicate reads比率也是影响外显子组项目质量的重要因素。文库制备和外显子组捕获过程会因PCR扩增不可避免地引入完全一致的DNA片段,即测序结果中的duplicate reads。duplicate reads的比率将影响测序深度的统计和变异的可靠性分析,该比率的高低主要取决于实验试剂的质量和实验操作的标准化程度。千年基因使用原厂测序试剂并严格规范实验流程,以基于Agilent捕获平台的外显子组测序为例,这一比例可控制在5%以内。
3、千年基因的测序质量为何最高
• 上市公司严格的管理制度;
• 17年基因组学服务经验;
• Illumina Genome Network亚太区唯一的一家成员,Illumina平台全球最高测序质量的代表;
• ISO9001 & ISO13485 & CLIA 国际质量标准认证的大型基因组学实验室,标准化的实验操作流程;
• 近年来平均每月完成近万份外显子组样本的测序及分析。
Illumina Genome Network是Illumina在全球的最高认证,承诺提供最高质量的数据和快速的周转时间,是研究人员选择测序服务的最佳保证。目前全球仅有Macrogen、Broad研究所、加拿大迈克•史密斯基因组科学中心(BCGSC)和国际基因组源中心(NCGR)四个机构通过认证。