BGISEQ PCR-free重测序大揭秘!

【字体: 时间:2019年12月05日 来源:华大科技

编辑推荐:

  今天给大家介绍的BGISEQ平台PCR-free重测序,不仅建库流程无PCR,测序流程也无PCR,最大程度避免了PCR引入的错误和偏向性,让测序得到的是真实的序列信息,更有利于检测真InDel。

PCR过程中可能会引入碱基错配[1];PCR扩增的偏向性会降低基因组覆盖度[2];同时PCR过程会引入错误的InDel[3]。

如果在建库、测序过程中剔除PCR扩增过程,就能提高基因组的覆盖度,还能提高变异检测的准确性,更有利于进行基因组学研究。

今天给大家介绍的BGISEQ平台PCR-free重测序,不仅建库流程无PCR,测序流程也无PCR,最大程度避免了PCR引入的错误和偏向性,让测序得到的是真实的序列信息,更有利于检测真InDel。

BGISEQ建库测序实现真PCR-free

BGISEQ平台PCR-free重测序实现了建库和测序过程的真PCR-free。如图1所示,对于I平台,测序过程必须通过桥式PCR扩增获得分子簇(cluster),才能达到放大检测信号的目的,即使是PCR-free建库(图2),在建库测序过程中最少也要有一步PCR。

而基于DNBSEQ™技术的BGISEQ测序平台,如果采用PCR-free建库(图3),那么可以保证建库过程中样本制备不会引入扩增错误和扩增偏向性;测序过程中采用滚环扩增(Rolling circle amplification,RCA),只以最初的单链环状文库为模板进行线性扩增,不会有PCR过程中错误的累积,真正实现了从建库到测序的“0”PCR。所以BGISEQ平台PCR-free重测序将无扩增错误的PCR-free文库建库方法与无拷贝错误累积的DNBSEQ™技术结合起来,实现真正的全基因组PCR-free测序,还原基因组真相。


图1  I平台两步PCR测序


图2  BGISEQ平台和I平台一步PCR测序


图3 BGISEQ平台“0”PCR测序

InDel检测更“真”,更精准-多检测真InDel近4万个

与I平台的PCR建库测序相比,BGISEQ平台PCR-free重测序检测InDel精准度和敏感度高出近8个百分点,基因组高置信区多检测真InDel达37000多个。

与I平台的PCR-free重测序相比,BGISEQ平台PCR-free重测序在基因组高置信区多检测真InDel也近18000个。所以BGISEQ平台PCR-free重测序相比其他平台和PCR建库,能检测到更多真实InDel!


图4 各平台PCR-free和PCR建库测序变异精准度和敏感度比较

注:数据来源于NA12878标准品30X重测序数据(更多信息见https://mp.weixin.qq.com/s/bzq8uvEMvJwRLgOi-ligRw)。

PCR-free建库带来更高的基因组覆盖均一性

建库测序过程中,如果有PCR扩增过程对基因组覆盖度均一性有较大影响。对于DNA模板而言,有的二级结构复杂,有的热稳定性差异大,这些因素都会影响PCR扩增效率。所以,在PCR扩增过程中无法保证所有基因组片段都能获得相同的扩增效率,而是存在明显的扩增偏向性,譬如在基因组高GC或低GC区域覆盖度低。但是BGISEQ平台PCR-free重测序全程无PCR,与PCR建库测序相比,在基因组高GC区、AT/TA重复区域覆盖度有大幅提高。


图5 PCR-free建库相比于PCR建库在基因组不同特征区域覆盖度的提升

注:Huge GC(gc>80%)-GC 含量高于80%,长度大于100bp区域;AT Dinucleotides -AT或TA串联重复序列,长度大于30bp;数据来源于小鼠24X重测序数据。

如图6所示,BGISEQ平台 PCR-Free的重测序深度频率分布(图6-左图,红色柱状图)非常接近于泊松分布的理想的测序深度频率(图6-左图,蓝色线状图),说明测序数据具有很好的基因组覆盖均一性。

值得注意的是,虽然BGISEQ平台PCR-free建库测序结果比PCR建库好,但是后者测序结果与理想情况相差也不大。而I平台的PCR-free建库结果比较符合理想情况,但PCR建库结果与理想情况差距较大(图7)。对于重测序检测变异而言,为了保证检测结果的准确性,需要有多条测序reads支持,如果某个区域覆盖度低,会导致在这些区域检测的变异准确度无法保证可能被过滤掉,如果为了保证这些区域的覆盖深度达到检测要求,那么测序数据量要大幅提高,带来测序成本的增加。


图6 BGISEQ平台PCR-free建库(左)和PCR建库(右)重测序深度频率分布

注:数据来源于NA12878标准品30X重测序数据,红色柱状图为测序深度频率统计结果,蓝色线图为符合泊松分布的理想测序深度频率。


图7 I平台PCR-free和PCR建库测序深度频率分布[4]

注:图片来源于官方渠道。

所以BGISEQ平台PCR-free重测序没有PCR扩增步骤,可以避免扩增引入的偏向性,具有更好的基因组覆盖均一性,更适合GC含量异常物种的重测序。统计不同GC含量的细菌测序结果GC偏向性,如图8-10所示:以100个碱基的大小为窗口,绘制GC含量分布图。灰色水平线表示理想的归一化覆盖度,表示为1.0, 蓝色点线表示样本的实际归一化的覆盖度。蓝色点线越接近1.0, 说明样本的基因组覆盖均一性越好。测序结果表明,BGISEQ平台PCR-free文库测序对于高GC、低GC物种基因组覆盖均一性与GC正常物种表现非常接近。


图8 GC含量62%的细菌(Olsenella Profusa)测序结果GC偏向性统计结果


图9 GC含量50%的细菌(E.coli)测序结果GC偏向性统计结果


图10 GC含量38%的细菌(Bacillus megaterium)测序结果GC偏向性统计结果

注:数据来源于3种不同GC含量的细菌30X测序

5742个商业文库数据表现稳定

BGISEQ平台PCR-free重测序不仅测试结果表现优异,在商业项目中,表现也很稳定。统计5492个文库动植物BGISEQ平台PCR-free重测序数据,下机数据Raw data %20平均为96.95,%30平均为89.14。


图11 动植物BGISEQ PCR-free重测序下机数据质量

统计250个 BGISEQ PCR-free 人重文库测序结果,数据表现同样优秀。

①下机数据Raw data %Q20平均为97.36,%Q30平均为90.01。


图12 人重BGISEQ PCR-free测序质量

② %GC含量平均值41.62%,符合人基因组序列特征。


图13 人重BGISEQ PCR-free 测序GC含量

③比对率平均值达到99.78%。


图14 人重BGISEQ PCR-free 测序比对率

④平均Duplicates比率2.36%,意味着用更少的Raw Data可以获得更高的有效深度和基因组覆盖度。


图15 人重BGISEQ PCR-free 测序Duplicates_Rate

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号