-
生物通官微
陪你抓住生命科技
跳动的脉搏
BGISEQ PCR-free重测序大揭秘!
【字体: 大 中 小 】 时间:2019年12月05日 来源:华大科技
编辑推荐:
今天给大家介绍的BGISEQ平台PCR-free重测序,不仅建库流程无PCR,测序流程也无PCR,最大程度避免了PCR引入的错误和偏向性,让测序得到的是真实的序列信息,更有利于检测真InDel。
PCR过程中可能会引入碱基错配[1];PCR扩增的偏向性会降低基因组覆盖度[2];同时PCR过程会引入错误的InDel[3]。
如果在建库、测序过程中剔除PCR扩增过程,就能提高基因组的覆盖度,还能提高变异检测的准确性,更有利于进行基因组学研究。
今天给大家介绍的BGISEQ平台PCR-free重测序,不仅建库流程无PCR,测序流程也无PCR,最大程度避免了PCR引入的错误和偏向性,让测序得到的是真实的序列信息,更有利于检测真InDel。
BGISEQ建库测序实现真PCR-free
BGISEQ平台PCR-free重测序实现了建库和测序过程的真PCR-free。如图1所示,对于I平台,测序过程必须通过桥式PCR扩增获得分子簇(cluster),才能达到放大检测信号的目的,即使是PCR-free建库(图2),在建库测序过程中最少也要有一步PCR。
而基于DNBSEQ™技术的BGISEQ测序平台,如果采用PCR-free建库(图3),那么可以保证建库过程中样本制备不会引入扩增错误和扩增偏向性;测序过程中采用滚环扩增(Rolling circle amplification,RCA),只以最初的单链环状文库为模板进行线性扩增,不会有PCR过程中错误的累积,真正实现了从建库到测序的“0”PCR。所以BGISEQ平台PCR-free重测序将无扩增错误的PCR-free文库建库方法与无拷贝错误累积的DNBSEQ™技术结合起来,实现真正的全基因组PCR-free测序,还原基因组真相。
图1 I平台两步PCR测序
图2 BGISEQ平台和I平台一步PCR测序
图3 BGISEQ平台“0”PCR测序
InDel检测更“真”,更精准-多检测真InDel近4万个
与I平台的PCR建库测序相比,BGISEQ平台PCR-free重测序检测InDel精准度和敏感度高出近8个百分点,基因组高置信区多检测真InDel达37000多个。
与I平台的PCR-free重测序相比,BGISEQ平台PCR-free重测序在基因组高置信区多检测真InDel也近18000个。所以BGISEQ平台PCR-free重测序相比其他平台和PCR建库,能检测到更多真实InDel!
图4 各平台PCR-free和PCR建库测序变异精准度和敏感度比较
注:数据来源于NA12878标准品30X重测序数据(更多信息见https://mp.weixin.qq.com/s/bzq8uvEMvJwRLgOi-ligRw)。
PCR-free建库带来更高的基因组覆盖均一性
建库测序过程中,如果有PCR扩增过程对基因组覆盖度均一性有较大影响。对于DNA模板而言,有的二级结构复杂,有的热稳定性差异大,这些因素都会影响PCR扩增效率。所以,在PCR扩增过程中无法保证所有基因组片段都能获得相同的扩增效率,而是存在明显的扩增偏向性,譬如在基因组高GC或低GC区域覆盖度低。但是BGISEQ平台PCR-free重测序全程无PCR,与PCR建库测序相比,在基因组高GC区、AT/TA重复区域覆盖度有大幅提高。
图5 PCR-free建库相比于PCR建库在基因组不同特征区域覆盖度的提升
注:Huge GC(gc>80%)-GC 含量高于80%,长度大于100bp区域;AT Dinucleotides -AT或TA串联重复序列,长度大于30bp;数据来源于小鼠24X重测序数据。
如图6所示,BGISEQ平台 PCR-Free的重测序深度频率分布(图6-左图,红色柱状图)非常接近于泊松分布的理想的测序深度频率(图6-左图,蓝色线状图),说明测序数据具有很好的基因组覆盖均一性。
值得注意的是,虽然BGISEQ平台PCR-free建库测序结果比PCR建库好,但是后者测序结果与理想情况相差也不大。而I平台的PCR-free建库结果比较符合理想情况,但PCR建库结果与理想情况差距较大(图7)。对于重测序检测变异而言,为了保证检测结果的准确性,需要有多条测序reads支持,如果某个区域覆盖度低,会导致在这些区域检测的变异准确度无法保证可能被过滤掉,如果为了保证这些区域的覆盖深度达到检测要求,那么测序数据量要大幅提高,带来测序成本的增加。
图6 BGISEQ平台PCR-free建库(左)和PCR建库(右)重测序深度频率分布
注:数据来源于NA12878标准品30X重测序数据,红色柱状图为测序深度频率统计结果,蓝色线图为符合泊松分布的理想测序深度频率。
图7 I平台PCR-free和PCR建库测序深度频率分布[4]
注:图片来源于官方渠道。
所以BGISEQ平台PCR-free重测序没有PCR扩增步骤,可以避免扩增引入的偏向性,具有更好的基因组覆盖均一性,更适合GC含量异常物种的重测序。统计不同GC含量的细菌测序结果GC偏向性,如图8-10所示:以100个碱基的大小为窗口,绘制GC含量分布图。灰色水平线表示理想的归一化覆盖度,表示为1.0, 蓝色点线表示样本的实际归一化的覆盖度。蓝色点线越接近1.0, 说明样本的基因组覆盖均一性越好。测序结果表明,BGISEQ平台PCR-free文库测序对于高GC、低GC物种基因组覆盖均一性与GC正常物种表现非常接近。
图8 GC含量62%的细菌(Olsenella Profusa)测序结果GC偏向性统计结果
图9 GC含量50%的细菌(E.coli)测序结果GC偏向性统计结果
图10 GC含量38%的细菌(Bacillus megaterium)测序结果GC偏向性统计结果
注:数据来源于3种不同GC含量的细菌30X测序
5742个商业文库数据表现稳定
BGISEQ平台PCR-free重测序不仅测试结果表现优异,在商业项目中,表现也很稳定。统计5492个文库动植物BGISEQ平台PCR-free重测序数据,下机数据Raw data %20平均为96.95,%30平均为89.14。
图11 动植物BGISEQ PCR-free重测序下机数据质量
统计250个 BGISEQ PCR-free 人重文库测序结果,数据表现同样优秀。
①下机数据Raw data %Q20平均为97.36,%Q30平均为90.01。
图12 人重BGISEQ PCR-free测序质量
② %GC含量平均值41.62%,符合人基因组序列特征。
图13 人重BGISEQ PCR-free 测序GC含量
③比对率平均值达到99.78%。
图14 人重BGISEQ PCR-free 测序比对率
④平均Duplicates比率2.36%,意味着用更少的Raw Data可以获得更高的有效深度和基因组覆盖度。
图15 人重BGISEQ PCR-free 测序Duplicates_Rate