回顾二十年漫漫测序路(1):昆虫基因组学

【字体: 时间:2022年02月18日 来源:PacBio

编辑推荐:

  正如华盛顿州立大学的博士后Scott Hotaling在回顾昆虫基因组测序20年时指出,“我们已经进入了昆虫基因组生物学的新时代”。

自从2000年黑腹果蝇(Drosophila melanogaster)基因组发表以来,昆虫基因组学已经取得了很大的进展。在近日召开的PacBio动植物基因组学大会(PAGBio Day 2022)上,PacBio回顾我们目前已取得了哪些进展。

截至2020年11月,GenBank数据库中已有601种不同昆虫的细胞核基因组组装。它们代表了20个不同的目,大小则从99 Mb(南极摇蚊)到6.5 Gb(东亚飞蝗)。

Inects-Genomes.png

GenBank中601种昆虫的基因组组装的分类表示
(截至2020年11月,图片来自PacBio)

如今,每两到三天就有一个新的昆虫物种基因组被存入GenBank。几乎50%(n=292)的昆虫基因组组装是在2019-2020年新加入的。与几年前的组装相比,这些新组装的连续性明显增强,部分原因是长读长组装的出现,其使用频率从2011-2012年的0%上升到2019-2020年的36.1%。

正如华盛顿州立大学的博士后Scott Hotaling在回顾昆虫基因组测序20年时指出,“我们已经进入了昆虫基因组生物学的新时代”。他说,这在很大程度上归功于测序和分析技术的快速发展,这些技术将基因组测序的力量带给了越来越多的研究人员。

“最值得一提的是长读长测序的影响;与不包含long reads的组装相比,包含long reads的组装在连续性上要高出约48倍,”他补充说。

据PacBio介绍,Sequel II测序系统上新增的低起始量和超低起始量工作流程让昆虫学家受益匪浅,因为它可以推动最小昆虫物种的测序。只需要5 ng基因组DNA,就可以构建单个昆虫的高质量基因组,而不需要采用耗时的繁殖或混合策略。

Scott Hotaling与杨百翰大学的Paul Frandsen等人在《Genome Biology and Evolution》杂志上发表题为“Long Reads Are Revolutionizing 20 Years of Insect Genome Sequencing”的综述。他们呼吁同行将昆虫基因组记录得更加完整。

研究人员指出,尽管600多个分类群似乎令人印象深刻,但在分类上还有很多空白。

“相对于陆地昆虫,水生昆虫作为一个群体的代表性不足。而且,有些目(如双翅目)所代表的基因组组装远远超过其物种多样性本身,然而许多目现在还没有基因组代表,”他们写道。

具体数字:

基因组测序和组装工作目前集中于四个目:双翅目、膜翅目、弹尾目和竹节虫目。

鞘翅目(昆虫纲第一大目)包含387,100种昆虫,其代表性明显不足。

6个目仅有一个基因组组装的代表,而11个目还没有公开发表的组装。

作者呼吁加强独立团体与研究联盟之间的整合,比如i5K计划,它准备对5000种不同节肢动物进行基因组测序。同时,研究人员要进行战略抽样以填补分类空白,针对特定问题生成数据,并扩大基因注释。

截至2019年,只有40%的昆虫基因组组装在GenBank中有相应的基因注释;作者认为,扩大和完善昆虫的基因注释,将推动分类比较的规模相应增加,这对于许多分析而言是可行的。

HiFi测序能够快速组装复杂的生物体,并帮助科学家建立更多样化的进化枝数据集。

Hotaling总结道:“公共知识库中的基因组组装代表了600多个分类群和约4.80亿年的进化史,昆虫基因组研究的力量和前景从未像现在这样强大。”

“我们赞同脊椎动物基因组计划(Vertebrate Genome Project)的发现——长读长组装比短读长方法更连续——并建议昆虫基因组科学家采用这些技术。”


订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号