编辑推荐:
为解决栉江珧(Atrina pectinata)人工繁育难题,研究人员开展其高质量染色体水平基因组组装与注释研究。利用多种测序技术,成功组装 951.01 Mb 基因组,注释 29,326 个蛋白编码基因,为该物种基因组学和生物学研究奠定基础。
在广袤的海洋世界里,栉江珧(Atrina pectinata)这种双壳贝类独具特色。它有着发达的足丝,能紧紧附着在潮间带,面对恶劣环境时还能迅速脱落;其硕大的闭壳肌肉质鲜美,具有较高的商业价值 。然而,过度捕捞、栖息地破坏和环境污染等因素,让栉江珧的种群数量急剧下降。为了恢复其种群资源,人工养殖迫在眉睫。但目前,栉江珧人工繁育面临诸多挑战,比如产卵诱导困难、幼虫黏连问题,这些问题的根源在于人们对其生殖生物学机制了解不足。而高质量的基因组是解开这些谜团的关键钥匙,此前栉江珧基因组未被测序,严重阻碍了相关研究的进展。
为了攻克这些难题,中国水产科学研究院黄海水产研究所等单位的研究人员开展了一项重要研究,相关成果发表在《Scientific Data》上。
研究人员采用了多种先进的技术方法。在样本采集上,选取了山东烟台长岛一只 4 岁、体长 20.81 cm、体高 10.12 cm 的栉江珧,采集其闭壳肌组织用于后续实验。在测序技术方面,综合运用了 Illumina 短读长测序、PacBio HiFi 长读长测序和 Hi-C 测序技术。Illumina 测序获取短读长数据,用于基因组 survey;PacBio HiFi 测序得到高精度长读长数据,助力基因组初步组装;Hi-C 测序则为染色体水平的组装提供关键信息。此外,还利用 PacBio ISO-Seq 进行转录组测序辅助基因组注释。
研究结果如下:
- 基因组组装:通过一系列技术流程,最终组装得到的栉江珧基因组大小为 951.01 Mb,与基于 k-mer 频率估算的 911.74 Mb 相近。其 scaffold N50 达到 52.64 Mb ,contig N50 为 5.29 Mb。利用 BUSCO 评估,98.8% 的完整 BUSCO 基因被成功捕获,表明基因组组装的完整性较高,且 98.87% 的序列成功锚定到 17 条染色体上。
- 基因注释:研究人员运用多种策略对基因组进行注释,共鉴定出 29,326 个蛋白编码基因。其中,84.25%(24,708 个)的基因获得了功能注释。以 eukaryota_odb10 库为参考,基因组注释完整性达 97.7%,单拷贝基因完整性为 97.3% 。
- 重复序列和非编码 RNA 注释:通过从头预测和基于同源性的方法,识别出大量重复序列,总量达 498.78 Mb,占基因组的 52.43%。同时,预测出 94 个 miRNA、766 个 tRNA、709 个 rRNA 和 243 个 sRNA。
研究结论和讨论部分指出,该研究构建的高质量染色体水平栉江珧基因组,为深入探究其生殖生物学机制提供了重要基础。有了这个基因组资源,科研人员可以进一步挖掘与生殖相关的基因和通路,为解决人工繁育难题提供理论依据。同时,也有助于理解栉江珧的生态适应性、进化历程等生物学特性,在保护和合理利用这一海洋生物资源方面具有重要意义。它不仅为栉江珧的遗传育种、资源保护和生态研究开辟了新途径,还为其他海洋生物的基因组学研究提供了宝贵的参考范例,推动整个海洋生物研究领域的发展。