编辑推荐:
研究人员为探究尖喙库蠓(Culicoides stellifer )传病作用,组装其基因组,发现非逆转录内源性病毒元件,为后续研究奠基。
研究背景
在广袤的自然界中,有一种微小却极具威胁的生物 —— 库蠓(Culicoides )。这些体长不足 3 毫米的小飞虫,却是虫媒病毒(arboviruses)的重要传播媒介,严重威胁着全球家畜和野生动物的健康。库蠓属种类繁多,已知有 1347 种,仅在北美就有 151 种。其中,尖喙库蠓分布广泛,在美国和加拿大东部大量存在,被怀疑是多种病毒的潜在传播媒介。然而,由于其体型微小,获取高质量的基因组 DNA 困难重重,目前关于库蠓的基因组研究极为匮乏,对其系统分类学的了解也十分有限。已有的库蠓基因组数据仅有两种,部分或完整注释的线粒体基因组也仅有四种,这远远无法满足我们对其进化特征、系统发育关系以及传病能力的深入探究。
为了填补这些知识空白,来自加拿大圭尔夫大学(University of Guelph)的研究人员挺身而出,开展了一项具有开创性的研究。他们的成果发表在《BMC Genomics》杂志上,为我们打开了一扇了解尖喙库蠓的新窗口。
研究方法
研究人员在圭尔夫大学安大略兽医学院奶牛场,利用微型疾病控制中心(CDC)紫外光诱捕器,采集了尖喙库蠓标本。随后,运用 PacBio 的超低 DNA 输入协议,从单只标本中提取基因组 DNA 进行测序。在测序完成后,研究人员使用了一系列生物信息学工具对数据进行处理和分析,如利用 MitoHiFi v3.2 和 IPA v1.8.0 等工具分别进行线粒体基因组和核基因组的组装,使用 Earl Grey v.4.1.1 进行重复元件注释,BRAKER3 v3.0.8 进行基因预测和功能注释,以及通过构建隐马尔可夫模型(HMM)来识别非逆转录内源性病毒元件(nrEVE)。
研究结果
测序与组装 :通过超低 DNA 输入工作流程进行 HiFi 测序,研究人员获得了 191,906 条 PacBio Hi-Fi 读数,平均读长约 13,000bp,覆盖度为 20X。基因组大小估计约为 104Mb,杂合度为 2.88%,重复序列占 11.4%。线粒体基因组的组装起初并不顺利,MitoHiFi 工具未能正确组装,后通过选择 128 条映射到参考线粒体基因组(C. arakawae )的读数,使用 IPA 组装器成功获得了 16,607bp 的线粒体基因组,其基因组成与其他库蠓属物种相似。核基因组的组装则比较了 IPA 和 Hifiasm 两种工具,最终选择了 Hifiasm -s 0.35 生成的组装结果,其基因组大小为 119Mb,contig N50 值为 479,264bp,L50 为 81,具有较高的质量。
基因组注释 :在基因组注释方面,研究人员发现尖喙库蠓基因组中重复元件约占 11%,其中 DNA 转座子比逆转录转座子占比更大,与C. sonorensis 基因组模式不同。BRAKER3 预测出 18,895 个蛋白质编码基因,其中 10,524 个通过搜索瑞士蛋白质数据库(Swiss-Prot)进行了注释,7,283 个基因映射到京都基因与基因组百科全书(KEGG)通路,7812 个蛋白质通过 InterProScan 进行了功能注释,4057 个被分配了基因本体(GO)术语。
nrEVE 的鉴定 :研究人员对整合的病毒片段进行基因组查询,发现了 38 个命中结果。其中,一个 322bp 的片段与水泡性口炎病毒(VSV)相似,进一步分析发现其包含一个完整的 1319bp 编码核衣壳蛋白的区域,该区域与弹状病毒(Rhabdovirus)核衣壳蛋白具有较高的相似性。通过将 PacBio 原始读数映射到包含该序列的重叠群,验证了该病毒序列的真实性。
研究结论与讨论
这项研究成功组装并注释了尖喙库蠓的核基因组和线粒体基因组,为深入了解该物种的潜在传病作用提供了重要的基因组信息。首次发现的 nrEVE 与弹状病毒核衣壳蛋白相关,这表明尖喙库蠓与弹状病毒之间存在密切且持续的关系,暗示着过去和现在 VSV 病毒在北美的分布可能与该宿主的分布有关。不过,由于目前的证据还无法完全确认该序列来自 VSV 病毒,后续还需要对更多个体进行测序,提高基因组的完整性。
研究中使用的超低 DNA 输入 PacBio 协议,为其他毫米级小型生物的基因组测序提供了可行的方法。但同时也发现,样本中的 DNA 存在一定程度的降解,未来的研究中,新鲜冷冻或新鲜乙醇保存且低温储存的标本可能更适合用于基因组测序。此外,基因组注释过程中发现了大量未知重复序列,这反映出参考数据库在昆虫重复序列注释方面的局限性。随着更多库蠓基因组的测序和研究,有望完善昆虫重复元件数据库,推动生物多样性基因组学研究的发展。
总的来说,该研究为理解病毒 - 宿主相互作用、管理病毒病原体传播以及开发针对库蠓传病的防控策略奠定了坚实的基础,具有重要的理论和实践意义。
打赏
下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究
10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!
欢迎下载Twist《不断变化的CRISPR筛选格局》电子书
单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析
下载《细胞内蛋白质互作分析方法电子书》