《Scientific Data》:A chromosome-level genome assembly and annotation of the Pseudorasbora elongata (Cypriniformes: Cyprinidae)
编辑推荐:
为解决长麦穗鱼(Pseudorasbora elongata)因缺乏染色体级参考基因组而阻碍其种群遗传学和保护生物学研究的问题,研究人员开展了长麦穗鱼染色体级基因组组装与注释的研究。通过多种技术得到 1.4 Gb 的基因组,该研究为其遗传学等研究提供基础,助力遗传保护策略的制定。
长麦穗鱼,一种独特的中国特有小型鱼类,因其身上独特的体色花纹,好似用中国毛笔绘制而成,故而被人们形象地称为 “中国毛笔鱼” 。它对生存环境颇为挑剔,偏好山间溪流这种水流平缓的栖息地。但由于水利工程建设改变了水文条件,加上环境污染等因素,长麦穗鱼的野生种群数量急剧下降,生存面临着严峻的挑战。在 20 世纪初,它就被列为易危物种,到 2023 年,又被安徽省政府列入重点保护野生动物名录。
尽管长麦穗鱼在分类学上属于鲤形目(Cypriniformes)、鮈亚科(Gobioninae)、麦穗鱼属(Pseudorasbora),但它与同属的其他物种在形态上存在显著差异,在进化关系上也较为特殊。此前对长麦穗鱼的研究十分有限,大多集中在特定功能性状的物种分化模式等方面,分子层面的研究少之又少。而其近缘物种麦穗鱼(Pseudorasbora parva),却因强大的入侵能力备受关注。目前,麦穗鱼属中仅有麦穗鱼的完整基因组数据被公布,其他物种的基因组信息仍处于未知状态。
为了深入了解长麦穗鱼的遗传奥秘,为其保护提供有力的科学依据,中国水产科学研究院淡水渔业研究中心的研究人员开展了一项重要研究。研究人员通过构建长麦穗鱼的染色体级基因组,为后续深入分析其基因组结构、功能基因的分布、基因家族的进化轨迹以及遗传变异程度奠定了坚实基础。这项研究成果发表在《Scientific Data》上,为长麦穗鱼的保护和研究开辟了新的道路。
研究人员为开展此项研究,运用了多种关键技术方法。首先,从安徽省秋浦河池州段采集长麦穗鱼样本,获取多个组织。接着,采用 PacBio HiFi reads、Oxford Nanopore Technologies 和 Hi-C 数据进行测序。通过构建不同类型的文库,如 BGISEQ 短读长文库、PacBio 长读长文库等,对基因组进行测序和组装。利用多种生物信息学软件,如 Hifiasm、purge_haplotigs 等,完成基因组组装、注释及质量评估。
下面来详细介绍研究结果:
- 基因组组装:研究人员利用 PacBio HiFi reads、Oxford Nanopore Technologies 和 Hi-C 数据,成功完成长麦穗鱼染色体级基因组组装。最终得到的基因组大小为 1.4 Gb,contig N50 达 34.4 Mb,scaffold N50 为 53.7 Mb,最大的 contig 长度达到 66.1 Mb。利用 Hi-C 数据将初步组装的序列锚定到 25 条染色体上,锚定率高达 99.13%,并填补了序列间的缺口,构建出首个染色体级别的基因组。
- 端粒鉴定与重复序列注释:通过特定方法,研究人员在 25 条染色体上共注释到 42 个端粒,在 1 条染色体的两端均检测到端粒。采用同源搜索与从头预测相结合的方式,对长麦穗鱼基因组中的重复序列进行全面鉴定,发现其基因组中 60.84% 为重复序列,其中 DNA 转座子、LINEs、SINEs 和 LTRs 分别占基因组的 35%、4.59%、0.62% 和 15.31%。
- 基因预测与注释:运用从头预测和同源预测两种方法,研究人员在长麦穗鱼基因组中预测出 25,180 和 24,730 个基因。借助多个数据库,对这些基因进行功能注释,成功注释了 99.64%(24,642 个)的预测基因,明确了这些基因在生物过程、分子功能和细胞组成等方面的作用。
- 非编码 RNA 预测与注释:研究人员使用 INFERNAL、tRNAscan-SE 等软件,在长麦穗鱼基因组中鉴定出 1,227 个 miRNA、22,040 个 tRNA、14,628 个 rRNA 和 1,368 个 snRNA。这些非编码 RNA 在基因表达调控等过程中发挥重要作用。
- 基因组共线性分析:通过对长麦穗鱼和麦穗鱼进行基因组共线性分析,发现二者存在高度共线性,这不仅验证了长麦穗鱼基因组组装的准确性,也为进一步研究二者的进化关系提供了重要线索。
在研究结论与讨论部分,研究人员成功构建了长麦穗鱼的染色体级基因组,这是该研究的核心成果。这一成果为深入了解长麦穗鱼的遗传信息提供了关键数据,有助于探究其种群遗传学特征,明晰其在进化历程中的位置,为制定科学有效的遗传保护策略提供了重要依据。同时,高质量的基因组组装和注释,为后续研究长麦穗鱼功能基因的特性、表达调控机制以及基因与环境的相互作用等奠定了坚实基础。该研究成果不仅对长麦穗鱼这一濒危物种的保护意义重大,也为整个麦穗鱼属的生物学研究提供了新的视角和有力工具,推动了鱼类遗传学和保护生物学领域的发展,为其他濒危物种的研究和保护提供了可借鉴的思路和方法。
涓嬭浇瀹夋嵎浼︾數瀛愪功銆婇€氳繃缁嗚優浠h阿鎻ず鏂扮殑鑽墿闈剁偣銆嬫帰绱㈠浣曢€氳繃浠h阿鍒嗘瀽淇冭繘鎮ㄧ殑鑽墿鍙戠幇鐮旂┒
10x Genomics鏂板搧Visium HD 寮€鍚崟缁嗚優鍒嗚鲸鐜囩殑鍏ㄨ浆褰曠粍绌洪棿鍒嗘瀽锛�
娆㈣繋涓嬭浇Twist銆婁笉鏂彉鍖栫殑CRISPR绛涢€夋牸灞€銆嬬數瀛愪功
鍗曠粏鑳炴祴搴忓叆闂ㄥぇ璁插爞 - 娣卞叆浜嗚В浠庣涓€涓崟缁嗚優瀹為獙璁捐鍒版暟鎹川鎺т笌鍙鍖栬В鏋�
涓嬭浇銆婄粏鑳炲唴铔嬬櫧璐ㄤ簰浣滃垎鏋愭柟娉曠數瀛愪功銆�