-
生物通官微
陪你抓住生命科技
跳动的脉搏
SMRT测序破译疟原虫参考基因组,更新物种进化系统发育树
【字体: 大 中 小 】 时间:2017年02月22日 来源:
编辑推荐:
来自Wellcome Trust Sanger研究所和其他机构的科学家近日在顶级杂志Nature上发表了一篇论文,对两个常见的疟原虫物种,三日疟原虫(P. malariae)和卵形疟原虫(P. ovale)的基因组进行了测序分析。研究人员收集了大量的样本对疟原虫的遗传信息和物种进化进行深入研究。
疟疾是经按蚊叮咬或输入带疟原虫者的血液而感染疟原虫所引起的虫媒传染病,是严重危害人类健康的疾病之一。
来自Wellcome Trust Sanger研究所和其他机构的科学家近日在顶级杂志Nature上发表了一篇论文,对两个常见的疟原虫物种,三日疟原虫(P. malariae)和卵形疟原虫(P. ovale)的基因组进行了测序分析。这两个物种在大多数地区均有流行,但由于在光镜下通常无法区分,并且缺乏明确的遗传信息,这一病原体的研究面临着重重阻碍,其物种的确切进化关系也一直有争议。因此,研究人员收集了大量的样本对疟原虫的遗传信息和物种进化进行深入研究。
图1. 三日疟原虫与卵形疟原虫的样本来源分布
该研究运用PacBio长读长测序技术,对三日疟原虫的基因组进行测序分析。文章指出,此次测序拼接产生的基因组质量远远超过了所有现有的基因组草图。特别是在基因组的连续性方面,达到了完全连续拼接,没有Gap的水平!可称得上是参考基因组级别的数据。值得一提的是,疟原虫基因组中的AT含量非常高,可达70%以上。事实上,NGS测序在面临高GC,或是高AT的区域时,都是一个非常大的挑战,而PacBio测序则能够完美的解决了这一问题。本次测序共拼接得到了33.6M的基因组数据,共63个contig,Contig N50达到2.3M,并且contig数目与scaffold数目相同,真正做到了无gap组装。同时,研究人员还使用二代测序结果为卵形疟原虫,以及被称为“P. malariae-like”的疟原虫物种绘制了高质量基因组草图。
图2 三日疟原虫样本PmUG01的基因组测序数据统计
通过与间日疟原虫基因组的比较,研究人员还发现了先前从未报道过的大的结构变异,其中就包含了一个6号染色体和10号染色体的相互异位和一个5号染色体的臂间倒位。
图3. 三日疟原虫基因组中新发现的大片段结构变异
由于有了更加完整的参考基因组,研究人员能够更加深入的对疟原虫复杂结构的基因组进行更细致的分析。基因组中大量假基因(>1200个)的形成以及端粒附近基因在不同亚群中的分布情况都得以展示。通过对假基因以及亚端粒区域基因群的分布情况,能够更加清晰的反应出不同疟原虫物种之间的亲缘与进化关系。
图4. 三日疟原虫样本PmUG01的基因分布统计
三日疟原虫基因组亚端粒区域中*显着的差异是存在两个大基因家族,在早期的部分基因组数据中并不明显,称为fam-1和fam-m。由fam-1和fam-m编码的蛋白质结构显示,它与红细胞表面抗原、黏附分子、信号肽等相互作用的相关。这一相关性对红细胞感染有着紧密联系。大多数fam-1和fam-m基因在端粒中作为双联体出现,并且一些证据表明,它们是共进化的。
图5. 疟原虫基因组中亚端粒区域基因家族的扩增。
本次研究的数据结果,在一定程度上改变了先前的疟原虫系统进化树版本,使得疟原虫的物种亲缘关系更加清晰,有利于其致病机理和物种适应性的研究。例如,本次研究的部分数据证明,感染啮齿类动物的疟原虫与感染人的卵形疟原虫更加类似,在进化树中,与卵形疟原虫更近。这表明卵形疟原虫的祖先存在由灵长类动物宿主向啮齿动物的转换。另外,在物种进化过程中,不同基因家族在进化中表现出的保守性与高度变异性对于病原体毒性与宿主适应性有着紧密的关联,因此也是基因功能研究的重点对象。
图6. 疟原虫属系统发育树
这项研究标志着疟原虫遗传学研究中的一个重大进步,绘制了更加完整的新的参考基因组。但由于基因组结构和基因家族的快速演变,作者指出我们迫切需要所有感染人类的疟原虫的高质量基因组数据,呼吁研究人员继续开展相关的研究工作。
参考原文
Gavin G. Rutledge, et al. "Plasmodium malariae and P. ovale genomes provide insights into malaria parasite evolution." Nature (2017).
原文链接
http://www.nature.com/nature/journal/v542/n7639/full/nature21038.html