-
生物通官微
陪你抓住生命科技
跳动的脉搏
真核基因组的组装,有纳米孔就够了
【字体: 大 中 小 】 时间:2016年11月09日 来源:生物通
编辑推荐:
农业生物技术公司KeyGene近日只利用纳米孔测序仪MinION生成的序列,组装了立枯丝核菌(Rhizoctonia solani)的基因组。立枯丝核菌是一种农业害虫,感染一些重要的经济作物,包括玉米、水稻和大豆。
生物通报道 农业生物技术公司KeyGene近日只利用纳米孔测序仪MinION生成的序列,组装了立枯丝核菌(Rhizoctonia solani)的基因组。立枯丝核菌是一种农业害虫,感染一些重要的经济作物,包括玉米、水稻和大豆。
在BioRxiv网站的预印本上,KeyGene的Martin de Vos及其同事介绍了他们的读长优化方法,这使得他们能够生成高度连续的组装,比之前利用短读长测序方法获得的组装要长得多。不过他们也指出,基于纳米孔的组装有着较高的错误率。尽管如此,研究人员认为,这仍是一种高性价比的方法。
在这项研究中,研究人员利用大小选择,从立枯丝核菌的样品中筛掉小的DNA片段,只留下高分子量的DNA。他们从中生成了三个长插入片段的纳米孔文库:两个是用随机剪切的DNA制备的,片段的平均长度分别为12.5 kb和18.8 kb,而第三个则来自完整的基因组DNA。
之后,研究人员利用Oxford Nanopore的MinION测序仪对这些文库进行测序,产生了近77,800条序列,转化成834 Mb,而平均读长为10.7 kb。他们指出,大多数长序列来自未剪切的文库。
De Vos及其同事利用canu assembler将这些序列组装成606个contig,它们跨越54 Mb,其中N50 contig的长度为199 kb。研究人员表示,这是目前最为连续的立枯丝核菌组装,也是仅仅利用纳米孔序列组装成的最大基因组。
研究人员进一步将他们的组装结果与Illumina MiSeq双端测序的结果进行比较。MiSeq运行产生了1390万条合并的序列,其平均读长为360个核苷酸,这些序列可组装成123,016个contig,总长度为71 Mb,而N50 contig的长度为1,029个核苷酸。
研究人员报告称,如果他们假设MiSeq的数据是完美的,那么纳米孔组装的错误率如下:每2186个碱基有一个替换错误,每700个碱基有一个插入错误,每297个碱基有一个缺失错误。
尽管这个错误率高于预期,但研究人员仍乐观表示,纳米孔测序技术和试剂的改进也许能够解决这个问题。他们指出,未来计划用高分子量DNA片段和高通量的PromethIon测序仪来对付高度重复的植物基因组。(生物通 余亮)
原文检索
The megabase-sized fungal genome of Rhizoctonia solani assembled from nanopore reads only.