黄河濒危特有鱼类鼻须鳅端粒到端粒参考基因组的构建及其意义

《Scientific Data》:Telomere-to-telomere reference genome of Rhinogobio nasutus, an endangered endemic fish from the Yellow River

【字体: 时间:2025年03月21日 来源:Scientific Data 5.8

编辑推荐:

  为保护濒危的黄河特有鱼类鼻须鳅(Rhinogobio nasutus),研究人员构建其端粒到端粒(T2T)参考基因组,助力相关研究。

  

研究背景

在黄河中上游,生活着一种独特的鱼类 —— 鼻须鳅(Rhinogobio nasutus),它不仅肉质鲜美,具有较高的经济价值,还在维持黄河生态系统平衡中扮演着重要角色。然而,近年来,过度捕捞、人类活动以及环境污染等因素,让鼻须鳅的生存面临着巨大挑战。非法的过度捕捞使它们的数量急剧减少,而水电设施的建设则阻碍了其洄游通道,再加上水污染和环境退化,鼻须鳅已被列为国家二级水生野生保护动物,在《中国生物多样性红色名录》中被评估为近危物种。
在科学研究领域,虽然对鼻须鳅的肌肉营养、分子标记和线粒体基因组等方面有一定的研究,但在基因组层面的研究却相对匮乏。传统的下一代测序(NGS)技术产生的短读长在覆盖复杂基因组区域时存在困难,难以准确全面地获取其基因组信息,这严重限制了对鼻须鳅遗传信息的深入了解,也给保护工作带来了阻碍。
为了更好地保护鼻须鳅,深入了解其遗传信息,甘肃省渔业科学研究所的研究人员开展了相关研究,构建了鼻须鳅的端粒到端粒(T2T)参考基因组。该研究成果发表在《Scientific Data》上,为鼻须鳅的遗传保护和相关进化研究提供了重要的资源。

研究方法

研究人员从甘肃白银(黄河景泰段)采集了鼻须鳅样本,并获得了动物保护和使用委员会的批准。采集了包括背肌组织、背鳍、皮肤等多个组织部位,用于 DNA 和 RNA 的提取。
在测序技术方面,研究人员使用了多种先进的测序方法。利用 MGI T7 平台进行下一代 DNA 测序;采用 PacBio Revio 平台的环形共识测序(CCS)模式,获得高质量的 HiFi reads;使用 Oxford Nanopore SQK - LSK109 试剂盒制备纳米孔文库,并在 PromethION 平台上进行测序;通过构建 Hi - C 文库,在 MGI T7 平台上进行 Hi - C 测序。
在基因组组装和注释过程中,研究人员利用多种软件和算法。通过 Hifiasm 软件结合 PacBio HiFi reads、ONT reads 和 Hi - C 数据生成初步的重叠群序列;使用 BWA 和 HiCUP 软件将 Hi - C 数据比对到组装的重叠群上,对重叠群进行染色体锚定;利用 minimap2、medaka consensus 和 blastn 进行端粒延伸,通过 TGS - GapCloser 填补间隙,最后使用 Pilon 软件进行基因组的抛光。在基因预测和注释方面,综合运用了从头预测、基于同源性的预测和 RNA - seq 辅助预测等方法,并通过 MAKER 和 HiFAP 软件整合注释数据,得到高质量的基因集。

研究结果

  1. 基因组组装:研究成功构建了鼻须鳅的 T2T 参考基因组,其总长度为 953,377,780 bp,scaffold N50 达到 38,227,425 bp,包含 12 个 scaffold,并成功锚定到 25 条常染色体上。通过多种评估方法,如 Hi - C 热图、短读长和长读长的映射率、BUSCO 评估等,证明了该基因组具有较高的质量,映射率分别达到 99.77% 和 99.85%,完整性(BUSCO)为 99.31%,准确性(QV)分别为 47.05 和 53.10。
  2. 基因注释:对基因组中的重复序列进行了注释,发现转座元件约占鼻须鳅基因组的 50.99%。通过多种预测方法,共预测出 24,677 个蛋白质编码基因,其中 98.16% 的基因得到了功能注释。同时,还对非编码 RNA 进行了预测和注释,共鉴定出 76,437 个非编码 RNA,包括 2,926 个 miRNA、36,511 个 tRNA、16,187 个 rRNA 和 2,313 个 snRNA。
  3. 基因家族分析:通过与其他 12 个物种的蛋白质序列进行比较,对鼻须鳅的基因家族进行了聚类分析。结果显示,24,677 个蛋白质编码基因中,23,848(~96.62%)被分组到 17,192 个直系同源簇中,包含 55 个独特家族和 194 个基因。
  4. 系统发育分析:基于单拷贝基因家族构建了系统发育树,并估计了鼻须鳅的分化时间。结果表明,鼻须鳅大约在 4630 万年前的始新世中期开始分化。

研究结论与意义

该研究成功构建了鼻须鳅的 T2T 参考基因组,为深入研究鼻须鳅的种群遗传学和保护生物学提供了宝贵的遗传资源。通过对基因组的分析,研究人员对鼻须鳅的基因结构、功能以及进化历史有了更深入的了解,这将有助于制定更有效的保护策略,保护这一濒危物种。同时,该基因组也为鲤科鱼类的系统发育和进化研究提供了重要的参考,推动了整个鱼类遗传学领域的发展。研究中所使用的技术方法和分析流程,也为其他物种的基因组研究提供了借鉴,具有重要的科学意义和应用价值。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
生物通微信公众号
微信
新浪微博

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号