真核基因组的组装,有纳米孔就够了

【字体: 时间:2016年11月09日 来源:生物通

编辑推荐:

  农业生物技术公司KeyGene近日只利用纳米孔测序仪MinION生成的序列,组装了立枯丝核菌(Rhizoctonia solani)的基因组。立枯丝核菌是一种农业害虫,感染一些重要的经济作物,包括玉米、水稻和大豆。

  

生物通报道 农业生物技术公司KeyGene近日只利用纳米孔测序仪MinION生成的序列,组装了立枯丝核菌(Rhizoctonia solani)的基因组。立枯丝核菌是一种农业害虫,感染一些重要的经济作物,包括玉米、水稻和大豆。

在BioRxiv网站的预印本上,KeyGene的Martin de Vos及其同事介绍了他们的读长优化方法,这使得他们能够生成高度连续的组装,比之前利用短读长测序方法获得的组装要长得多。不过他们也指出,基于纳米孔的组装有着较高的错误率。尽管如此,研究人员认为,这仍是一种高性价比的方法。

在这项研究中,研究人员利用大小选择,从立枯丝核菌的样品中筛掉小的DNA片段,只留下高分子量的DNA。他们从中生成了三个长插入片段的纳米孔文库:两个是用随机剪切的DNA制备的,片段的平均长度分别为12.5 kb和18.8 kb,而第三个则来自完整的基因组DNA。

之后,研究人员利用Oxford Nanopore的MinION测序仪对这些文库进行测序,产生了近77,800条序列,转化成834 Mb,而平均读长为10.7 kb。他们指出,大多数长序列来自未剪切的文库。

De Vos及其同事利用canu assembler将这些序列组装成606个contig,它们跨越54 Mb,其中N50 contig的长度为199 kb。研究人员表示,这是目前最为连续的立枯丝核菌组装,也是仅仅利用纳米孔序列组装成的最大基因组。

研究人员进一步将他们的组装结果与Illumina MiSeq双端测序的结果进行比较。MiSeq运行产生了1390万条合并的序列,其平均读长为360个核苷酸,这些序列可组装成123,016个contig,总长度为71 Mb,而N50 contig的长度为1,029个核苷酸。

研究人员报告称,如果他们假设MiSeq的数据是完美的,那么纳米孔组装的错误率如下:每2186个碱基有一个替换错误,每700个碱基有一个插入错误,每297个碱基有一个缺失错误。

尽管这个错误率高于预期,但研究人员仍乐观表示,纳米孔测序技术和试剂的改进也许能够解决这个问题。他们指出,未来计划用高分子量DNA片段和高通量的PromethIon测序仪来对付高度重复的植物基因组。(生物通 余亮)

原文检索

The megabase-sized fungal genome of Rhizoctonia solani assembled from nanopore reads only.

doi: http://dx.doi.org/10.1101/084772

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号