Nature子刊:单分子测序揭示鹦鹉模仿能力

【字体: 时间:2012年07月04日 来源:生物通

编辑推荐:

  研究团队通过单分子测序揭示了鹦鹉基因组的特殊区域,并采用第二代测序技术对单分子测序数据进行了修正。文章发表在7月1日Nature Biotechnology杂志网站上。

  

生物通报道:研究团队通过单分子测序揭示了鹦鹉基因组的特殊区域,并采用第二代测序技术对单分子测序数据进行了修正。文章发表在71Nature Biotechnology杂志网站上。

如今单分子测序技术炙手可热,这一新技术能生成超长的测序读段,“能更容易拼装基因组的复杂部分,”文章的共同作者Duke大学神经学生物学家Erich Jarvis说。Jarvis感兴趣的是调控鹦鹉模仿能力的基因序列,因为这些序列能为神经学科学家提供人类语言能力相关调控基因的信息。

Jarvis及其同事最初采用第二代测序来装配鹦鹉的基因组区域,第二代测序技术能一次读取100400bp,需要数天来装配基因组构架图。然而,科学家测序后发现得到的读长不足以装配出鸣声学习基因的某些调控区域。尽管研究人员尝试了修改算法,仍无法解决这一问题。

去年罗氏454Pacific Biosciences单分子测序技术的读长都达到了1000bp。而Pacbio的技术能一次生成2,250 23,000bp的数据,能在约一天内装配整个基因组。

Jarvis及其同事采用了PacBio RS仪器来解决他们基因组测序遇到的难题。通过Assemblathon竞争,科学家发现Pacbio仪器在读取虎皮鹦鹉(Melopsittacus undulates)基因组时,难以精确解码某些复杂区域,仪器的错误率较高。Jarvis说,这种错误率几乎使他们难以用这些超长读段进行基因组装配。

单分子测序仪器能生成超长序列,极大的改善基因组和转录组的装配。不过,目前单分子测序读取的错误率较高,从而限制了其应用(如细菌重测序应用)。而第二代测序产生的读段虽然短,但精确性更高。

研究人员引入了一种修正算法和装配策略,应用第二代测序产生的短高保真序列对单分子测序进行了修正。他们成功将单分子测序(或称为第三代测序)仪的错误率从15%减少到了小于0.1%。由此,科学家终于装配出了鹦鹉鸣声学习行相关基因的调控区域(如FoxP2基因和egr1基因)。

这一研究成果能帮助神经学科学家能更好的了解鸟类模仿和鸣唱的遗传学机制。同时也能为科学家提供有关人类交流和语言学习能力的遗传信息。

研究人员还对PacBio RS仪器生成的多种噬菌体、原核生物和真核生物的测序数据进行了修正,验证了该方法的可靠性。Jarvis认为科学家能够通过使用混合性测序方法,解码癌细胞发育相关的复杂基因和控制大脑功能的复杂基因序列。

(生物通编辑:叶予)

生物通推荐原文摘要:

Hybrid error correction and de novo assembly of single-molecule sequencing reads

Single-molecule sequencing instruments can generate multikilobase sequences with the potential to greatly improve genome and transcriptome assembly. However, the error rates of single-molecule reads are high, which has limited their use thus far to resequencing bacteria. To address this limitation, we introduce a correction algorithm and assembly strategy that uses short, high-fidelity sequences to correct the error in single-molecule sequences. We demonstrate the utility of this approach on reads generated by a PacBio RS instrument from phage, prokaryotic and eukaryotic whole genomes, including the previously unsequenced genome of the parrot Melopsittacus undulatus, as well as for RNA-Seq reads of the corn (Zea mays) transcriptome. Our long-read correction achieves >99.9% base-call accuracy, leading to substantially better assemblies than current sequencing strategies: in the best example, the median contig size was quintupled relative to high-coverage, second-generation assemblies. Greater gains are predicted if read lengths continue to increase, including the prospect of single-contig bacterial chromosome assembly.
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号