编辑推荐:
为解决普通草蛉(Chrysoperla zastrowi sillemi )基因组信息匮乏的问题,ICAR - National Bureau of Agricultural Insect Resources 的研究人员开展其基因组组装研究,得到高质量基因组。这为生物防治育种提供依据,强烈推荐科研读者阅读。
印度农业研究委员会国家农业昆虫资源局(ICAR - National Bureau of Agricultural Insect Resources)的研究人员 Muthugounder Mohan、Thiruvengadam Venkatesan 等人在《Scientific Data》期刊上发表了题为 “High - quality genome assembly of a cosmopolitan insect predator, Chrysoperla zastrowi sillemi (Esben - Petersen)” 的论文。这篇论文对于生物防治领域意义重大,它为深入了解广食性昆虫捕食者 —— 普通草蛉(Chrysoperla zastrowi sillemi)的基因组信息提供了关键依据,有助于提升其在农作物害虫防治方面的应用潜力。
一、研究背景
在综合虫害管理(Integrated Pest Management,IPM)中,生物防治是至关重要的一环,它利用自然界中的天敌来控制害虫数量。普通草蛉(Chrysoperla zastrowi sillemi),也被称为绿草蛉或蚜狮,属于脉翅目草蛉科(Neuroptera: Chrysopidae),是生物防治的关键组成部分 。它捕食能力强,主要以螨虫、蚜虫、介壳虫、叶蝉和小型鳞翅目幼虫为食。许多研究已经在实验室和田间条件下证明了普通草蛉的捕食效果。然而,要深入了解其功能基因组学,获取该捕食性物种的全基因组信息至关重要。此前,关于普通草蛉在适应性进化和捕食者 - 猎物相互作用方面的基因组信息十分匮乏,这限制了人们进一步挖掘其捕食潜力,因此开展这项研究迫在眉睫。
二、研究方法
昆虫培养 :研究人员在印度农业研究委员会国家农业昆虫资源局(ICAR - NBAIR)饲养了普通草蛉实验室种群(国家登录号 NBAII - MP - TRI - 15),该种群已繁衍超过 100 代。实验选取刚羽化且饥饿的成虫用于基因组测序。
DNA 和 RNA 提取 :按照 Qiagen 公司 DNAesay? 血液和组织试剂盒的操作说明,从雌雄成虫中提取 DNA,在提取前,昆虫需饥饿 24 小时。同时,使用 RNAeasy? 试剂盒(Qiagen),根据制造商的方案,从普通草蛉的成虫、幼虫和蛹中提取总 RNA。
基因组测序 :利用 SMRTbell? express 模板制备试剂盒 2.0 在 PacBio Sequel II 平台上制备 DNA 文库,生成 HiFi reads,用于初步组装。此外,分别按照 NEBNext 的 Ultra II FS DNA 文库制备试剂盒和 Ultra? II 定向 RNA 文库制备试剂盒(适用于 Illumina?)的方案,构建高质量的 RNA 和 DNA 文库,进行短读长深度测序,用于组装优化和验证。运用 Arima Genome - Wide HiC + 试剂盒制备高质量的 Hi - C 文库,并在 Illumina Novaseq6000 上进行双端测序,以检测细胞核中的染色质结构和相互作用。通过基于 k - mer 的计数器 Jellyfish 估计基因组大小,再用 GenomeScope2 分析 Jellyfish 的结果,获取杂合度、重复长度和基因组大小等信息。利用 Illumina NovaSeq6000 平台进行转录组测序,以提高基因预测的准确性。
基因组组装 :直接使用 PacBio HiFi reads 生成初步组装结果。运用 Hifiasm assembler 在 HiFi - only 模式下获得单倍型解析组装。使用 Trinity de novo assembler 从 RNA - seq 数据生成转录组组装。通过 CDHIT - EST 根据序列和长度相似性对组装内的相似核苷酸序列进行聚类,将长度和序列相似度达到 90% 的转录本归为一组,仅保留一个代表性转录本(Unigene)。
Hi - C 脚手架搭建和组装优化 :利用 HiCUP 管道将测序读数与组装结果进行比对,并过滤掉人为实验假象。YAHS 管道利用这些比对信息连接间隙、重新定向序列,生成更连续的支架 / 假分子。使用 Kraken2 筛选组装中可能存在的细菌污染,筛选时使用包含古细菌、细菌、病毒、质粒、人类和 UniVec Core 序列的标准数据库。
组装验证 :使用 BWA 和 Hisat2 比对器将全基因组和 RNA - seq 数据映射回组装结果,以此进行验证。采用 Benchmarking Universal Single - Copy Orthologs(BUSCO)评估组装的完整性和注释质量,使用 insecta_db10 数据库评估普通草蛉组装的完整性。同时,运用 Core Eukaryotic Genes Mapping Approach(CEGMA),结合 248 个保守真核基因数据库,通过隐马尔可夫模型(Hidden Markov Models,HMMs)评估组装完整性和注释。
重复序列预测 :利用 RepeatMasker 在组装中识别重复序列,它使用 Dfam(v3.6)数据库对识别出的重复区域进行软屏蔽,并利用 RepeatModeller、Transposon - psi 和 LTRharvest 的预测结果创建自定义文库。通过 USEARCH 对自定义 FASTA 序列进行聚类,去除冗余序列,再将其作为参考提供给 RepeatMasker 进行第二轮重复序列屏蔽。
基因预测 :利用 Maker2 管道进行基因预测,它整合了从头算基因预测器 Augustus 和 GeneMark - ES,并结合相关物种的转录本和蛋白质证据来预测组装中的基因。Prothint2 管道利用 OrthoDB 的 arthropoda_odb10 数据集,从组装中获取剪接位点、内含子、起始和终止密码子等提示信息。结合 GeneMark EP + 和来自直系同源蛋白质序列的蛋白质提示信息,进行准确的基因预测。从 NCBI 数据库下载草蛉科蛋白质,并将从头组装的转录组组装结果作为 Maker2 基因预测的证据。筛选预测基因时,设定注释编辑距离(Annotation Edit Distance,AED)值小于 1,且保证有足够的外显子和剪接位点覆盖作为参数。
基因组注释 :使用 NCBI Refseq 数据库中的蛋白质序列对预测的转录本 / 蛋白质进行注释,注释工具为 NCBI Blast +(v2.11)。基于 EggNOG 数据库,利用 EggNOG mapper 将蛋白质进一步分类到功能注释类别,如基因本体(Gene Ontology)、真核同源基因群(eukaryotic orthologous groups,KOGs)、京都基因与基因组百科全书(KEGG)通路和 PFAM 结构域。
特殊染色体鉴定及分析 :通过与已公布的 Chrysoperla carnea X 染色体(NCBI 登录号:NC058342.1)进行共线性分析,确定普通草蛉的 X 染色体,共线性分析使用 D - GENIES 软件和 minimap2 比对器。根据组装覆盖信息和与其他已公布的草蛉科组装的同源性比对,识别线粒体组装,并利用 Mitos2 网络服务器预测线粒体基因。运用 MCScanX 计算染色体间的共线块和共线性片段,将普通草蛉的基因组组装与 Chrysoperla carnea 的基因组组装进行比较,并在 SynVisio 在线平台(https://synvisio.github.io/ )上查看共线性。
三、研究结果
基因组特征 :通过 k - mer 分析估计普通草蛉的基因组大小为 566 Mb,最终组装的基因组大小为 597 Mb,支架 N50 为 30.4 Mb。基因组被组装成 6 个染色体假分子,覆盖了 84% 的基因组,假染色体大小在 29.37 Mb 至 170.05 Mb 之间,总大小为 502 Mb。Hi - C 相互作用分析表明,染色体上两个相对靠近的基因组区域之间存在强相互作用信号,较高的顺式 / 反式比率表明染色体内部读数富集,顺式长 / 短比率大于 1.5,说明 Hi - C 实验捕获到了长距离染色质相互作用。
基因注释 :去除重复序列后,共注释出 14,495 个蛋白质编码基因。同时,注释并分类了 4,572 个非编码 RNA,包括 1,175 个 rRNA、54 个 miRNA、47 个 snRNA、125 个剪接体 RNA 和 2,070 个 tRNA。重复元件占基因组的 57.31%,大小为 342.5 Mb,其中未分类的重复序列占比高达 53.8%,这在早期分化的昆虫目(如脉翅目)中较为常见。
线粒体基因组 :预测普通草蛉完整的线粒体基因组长度为 16,048 bp,GC 含量为 21.1%,包含 22 个 tRNA 基因、13 个蛋白质编码基因和 3 个 rRNA 基因,且基因无重排现象。
共线性分析 :共线性分析显示,普通草蛉与 Chrysoperla carnea 的基因组之间存在很强的共线性。
四、研究结论与讨论
本研究成功获得了普通草蛉高质量、染色体水平的基因组组装。研究结果为选择可遗传性状进行选择性育种提供了关键的基因组信息,有助于提高普通草蛉的生物防治潜力。通过对其基因组的解析,人们能够更深入地了解普通草蛉生活史特征的各个方面,包括捕食者 - 猎物相互作用的进化以及它的生态适应性。这对于生物防治领域来说意义非凡,为进一步开发和利用普通草蛉进行农作物害虫防治提供了坚实的理论基础。同时,研究中采用的先进测序和分析技术,也为其他昆虫基因组研究提供了有益的参考,推动了整个昆虫基因组学领域的发展。未来,基于这些基因组信息,可以开展更深入的功能研究,探索普通草蛉在不同生态环境下的适应性机制,以及如何更好地优化其生物防治效果,为农业可持续发展做出更大的贡献。
打赏
下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究
10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!
欢迎下载Twist《不断变化的CRISPR筛选格局》电子书
单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析
下载《细胞内蛋白质互作分析方法电子书》