日本囊对虾染色体水平基因组图谱的破译:为甲壳类遗传育种与进化研究提供新资源

《Scientific Data》:Chromosome-level genome assembly and annotation of the kuruma shrimp Marsupenaeus japonicus

【字体: 时间:2025年12月14日 来源:Scientific Data 6.9

编辑推荐:

  本研究针对日本囊对虾(Marsupenaeus japonicus)现有基因组组装存在的染色体数目争议(2n=86 vs 已发表42条)和连续性不足等问题,研究人员通过整合PacBio长读长、Illumina短读长和Hi-C scaffolding技术,成功构建了高质量的染色体水平基因组。最终获得1.64 Gb基因组(contig N50 324.18 kb,scaffold N50 40.61 Mb),97.83%序列锚定至43条染色体,注释到21,172个蛋白编码基因,BUSCO完整性达91.0%。该基因组为对虾遗传育种和分子机制研究提供了重要资源。

  
在浩瀚的海洋生物资源中,日本囊对虾(Marsupenaeus japonicus)作为对虾科中经济价值最高的物种之一,以其鲜美的口感、快速的生长速度和惊人的耐低氧能力而闻名,这种虾甚至能够离水存活超过10小时。正是这些优良特性,使其成为全球渔业和水产养殖业的重要支柱。据统计,仅2023年中国的年产量就达到45,968吨。然而,与这种虾的重要经济地位形成鲜明对比的是,其基因组学研究长期滞后。
甲壳动物在生态系统中扮演着双重角色:不仅是提供优质蛋白质的重要经济物种,还是水生生态系统健康的关键生物指示剂和海洋营养网络中的基石物种。但由于测序技术的限制,甲壳动物的基因组学研究一直落后于其他物种,直到2019年才取得突破性进展。十足目作为甲壳动物中最高等、最大的目类,其基因组由于体积大、杂合度高和重复序列含量高等特点,组装难度极大。
虽然此前已有日本囊对虾基因组的相关研究报道,但存在明显局限性。最突出的问题是已发表的基因组组装(1.54 Gb)仅锚定到42条伪染色体,而细胞遗传学研究一致表明该物种的二倍体染色体数目应为2n=86。这种差异提示了染色体尺度支架可能存在错误或单倍型重复未解决。此外,先前组装的连续性也不理想,contig N50值仅为229.97 kb,限制了其在基因组结构变异和重复区域研究中的应用价值。
为了填补这些空白,厦门大学的研究团队在《Scientific Data》上发表了最新研究成果。他们采用PacBio长读长测序、Illumina短读长和Hi-C支架技术的组合策略,成功构建了新一代染色体水平的日本囊对虾参考基因组。这一高质量基因组资源将为对虾的遗传育种和分子机制研究提供重要基础。
关键技术方法概述
研究人员采集自厦门自然海域的健康成年雄性日本囊对虾(品种I)肌肉组织,分别构建PacBio长读长文库(插入片段15-20 kb)、Illumina短插入文库(350 bp)和Hi-C文库。通过K-mer分析(K=17)预估基因组大小为2.47 Gb,重复序列含量77.97%,杂合率0.49%。使用WTDBG2进行从头组装,NextPolish进行抛光校正,最终通过ALLHiC进行Hi-C支架,获得染色体水平组装。
基因组组装与特征分析
通过K-mer分析预估日本囊对虾基因组大小约为2,469.11 Mb,重复序列含量和杂合率分别为77.97%和0.49%。实际组装获得的基因组大小为1.64 Gb,包含15,814个contig,contig N50为324.18 kb。经过Hi-C支架后,97.83%(1.60 Gb)的组装序列成功锚定到43条染色体上,scaffold N50达到40.61 Mb。43条染色体的长度范围在4.11 Mb至58.06 Mb之间,平均长度为37.28 Mb。BUSCO评估显示基因组完整性为91.0%,其中90.2%为单拷贝BUSCOs,仅0.8%为重复BUSCOs。
重复序列注释
采用同源比对和从头预测相结合的方法进行重复序列注释。结果显示重复序列占基因组的62.79%,其中长末端重复序列(LTRs)最为丰富,覆盖超过924 Mb(占基因组的56.41%)。其他主要重复类别包括长散布核元件(LINEs),占28.77 Mb(1.76%),以及DNA转座子,占10.52 Mb(0.64%)。
蛋白编码基因预测与功能注释
整合同源预测、从头预测和RNA-Seq辅助预测进行基因模型的结构注释。从果蝇(Drosophila melanogaster)、水蚤(Daphnia pulex)、凡纳滨对虾(Litopenaeus vannamei)和三疣梭子蟹(Portunus trituberculatus)等物种获取同源蛋白序列,使用多种预测工具进行基因预测。最终成功预测出21,172个蛋白编码基因,这些基因平均编码序列长度为1,385.78 bp,平均基因长度为13,876.34 bp,平均外显子数为6.48。功能注释显示,17,615个基因(83.20%)被成功注释,其中Swissprot数据库注释13,067个(61.70%),NR数据库注释17,514个(82.70%),KEGG通路注释13,344个(63.00%)。
非编码RNA基因注释
使用tRNAscan-SE预测tRNA,通过BLAST比对预测rRNA,利用Infernal对Rfam数据库进行miRNA和snRNA的识别。共注释了195个rRNA、2,350个tRNA、36,384个miRNA和3,741个snRNA。其中rRNA包括78个18S rRNA、10个28S rRNA、1个5.8S rRNA和106个5S rRNA。
进化分析与分化时间预测
通过OrthoFinder从日本囊对虾、凡纳滨对虾、斑节对虾(Penaeus monodon)、三疣梭子蟹、普通卷甲虫(Armadillidium vulgare)、霍亚水蚤(Hyalella Azteca)和水蚤(Daphnia pulex)七个物种中鉴定出450个严格单拷贝直系同源基因。利用MUSCLE进行多序列比对,RAxML构建最大似然系统发育树。CAFE分析显示,日本囊对虾有6,804个基因家族发生扩张,938个发生收缩。进化分析表明,日本囊对虾与凡纳滨对虾和斑节对虾亲缘关系最近,它们从共同祖先分化的时间约为8833万年前。
数据可及性与技术验证
所有原始测序数据已存入NCBI SRA数据库(登录号SRP581623),染色体水平组装存入ENA数据库(登录号PRJEB102642),基因组注释文件保存在figshare平台。通过BUSCO和CEGMA评估基因组组装完整性,分别显示91.0%的完整性和91.13%的核心基因组装率。Illumina短读长比对结果显示92.98%的读长成功比对,覆盖率约为82.92%。
研究结论与意义
这项研究成功构建了高质量的日本囊对虾染色体水平基因组,解决了先前基因组组装中存在的染色体数目争议和连续性问题。新组装的基因组大小为1.64 Gb,97.83%的序列锚定到43条染色体,与细胞遗传学研究的2n=86染色体数目更加吻合。基因组注释揭示了21,172个蛋白编码基因和丰富的重复序列特征,BUSCO评估91.0%的完整性证明了组装的高质量。
进化分析明确了日本囊对虾在甲壳动物中的系统发育位置,其与凡纳滨对虾和斑节对虾的分化时间约为8833万年前,基因家族扩张和收缩模式为了解其适应性进化提供了线索。这一高质量的基因组资源不仅为日本囊对虾的遗传育种研究提供了重要基础,也为比较基因组学和甲壳动物进化研究开辟了新途径。研究人员强调,该基因组将有助于解析对虾的重要经济性状的分子基础,如生长速度、抗逆性和品质特性,对促进对虾养殖业的可持续发展具有重要意义。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号