改良的香港鲶鱼染色体水平基因组组装及注释

【字体: 时间:2025年02月02日 来源:Scientific Data 5.8

  

香港鲇高质量染色体水平基因组组装与注释研究解读


广东海洋大学水产学院等单位的研究人员在Scientific Data期刊上发表了题为 “An improved chromosome-level genome assembly and annotation of Hong Kong catfish (Clarias fuscus)” 的论文。该研究成果为香港鲇(Clarias fuscus)的遗传研究和育种计划提供了重要的基因组资源,对推动该物种的分子育种和功能基因组学研究意义重大,有助于深入了解其重要经济性状和性别决定的分子机制,为优化养殖策略、提高养殖效益奠定了坚实的理论基础 。

一、研究背景


鲇形目鱼类种类繁多,全球分布广泛,约占硬骨鱼类的 12%,在进化生物学研究中具有重要地位。其具备高繁殖力、强抗逆性、饲料转化率高、无肌间刺和肉质鲜嫩等优势,在水产养殖领域经济价值显著。2022 年,鲇鱼养殖在约 90 个国家开展,为全球水产养殖产量贡献了 10.8% 。胡子鲇科鱼类拥有辅助呼吸器官,对低溶氧环境耐受性强,在亚洲和非洲等主要鲇鱼产区的养殖中占据主导地位。此外,该科鱼类性别决定系统多样,如大口鲇的 XX/XY 系统、埃及胡子鲇的 ZZ/ZW 模式,以及革胡子鲇两种性别决定系统共存的现象,使得高质量参考基因组对于解析其性别决定机制和重要经济性状的分子基础至关重要。

香港鲇是中国胡子鲇科唯一的本土物种,凭借其适应性强、营养价值高和肉质鲜嫩的特点,在中国华南地区推动了大规模水产养殖业的发展。该物种存在明显的性生长二态性,雄性生长速度快于雌性,全雄养殖具有更高的经济效益。然而,目前关于香港鲇性别决定机制的研究仍存在诸多局限,现有的雄性基因组在组装 X 和 Y 染色体序列时存在混淆,性染色体结构的比较分析也面临挑战,且基因组组装存在较多缺口,结构注释信息缺失或错误,这些问题迫切需要通过构建高质量的基因组来解决 。

二、研究材料与方法


(一)样本采集与核酸提取


研究人员从广西水产引育种中心采集了一条健康成年雌性香港鲇(体重 250g,体长 29.7cm)。经丁香酚麻醉后,迅速解剖获取肌肉、脑、肝、脾、肠、肾、性腺和皮肤等组织,置于液氮速冻后保存于 - 80°C。肌肉组织用于 DNA 提取和全基因组测序文库构建,所有组织均用于 RNA 提取和 cDNA 文库构建。分别采用标准酚 - 氯仿法提取基因组 DNA,用 NanoDrop 2000、Qubit 2.0 和 Agilent 4200 评估 DNA 浓度和质量;用 NanoDrop 2000 和 LabChip Touch 评估总 RNA 的浓度和质量 。

(二)文库构建与测序


针对全基因组 MGI 测序文库,将基因组 DNA 超声破碎至 300 - 350bp,按照 MGI 标准协议进行末端修复、A 尾添加、接头连接、纯化和 PCR 扩增,在 DNBSEQ-T7 平台上进行双端测序,经 fastp 软件去除低质量和冗余读段后,获得 68.28Gb 的清洁数据。利用 g-TUBEs 对 gDNA 进行片段化处理,构建长读长 SMRTbell 文库(≥20kb),在 PacBio Sequel II 系统上采用 CCS 模式测序,得到 37.37Gb 的一致性读段 。在 Hi-C 测序中,对肌肉组织进行甲醛交联、MboI 酶切、末端修复、生物素标记、连接和蛋白酶 K 消化等操作,经 MGI 测序和质量控制后,获得 89.31Gb 清洁数据。RNA 文库经 MGI 测序和质量控制后,产生 13.13Gb 清洁数据 。

(三)基因组调查与组装


利用 MGI 测序获得的短读长数据,通过 GCE 软件基于 17-mer 频率分布方法进行基因组调查,评估香港鲇的基因组大小、杂合度和重复序列含量。使用 Hifiasm 算法对 PacBio HiFi 读段进行初步基因组组装,再用 Purge Haplotigs 去除冗余重叠群。利用 Hi-C 数据进行染色体锚定,通过 Bowtie2 比对读段,HiCUP 管道过滤无效比对,Juicer 和 3d-DNA 软件进行重叠群重排、定向和构建支架,最后用 JuiceBox 进行手动优化和纠错 。

(四)基因组注释


重复序列注释采用同源预测和从头预测相结合的方法,分别使用 RepeatMasker、RepeatProteinMask、RepeatModeler 和 LTR_FINDER 等软件。非编码 RNA 注释中,tRNA 用 tRNAscan-SE 预测,rRNA 通过 BLAST 与近缘物种比对检测,miRNA 和 snRNA 分别基于 Rfam 数据库的协方差模型和 INFERNAL 软件预测 。蛋白质编码基因预测则综合运用同源预测、从头预测和 RNA-seq 预测三种策略,将预测结果用 MAKER2 和 HiFAP 整合优化,最后利用多个公共数据库进行功能注释 。

(五)染色体同源分析


以雌性基因组为参考,使用 Minimap2 对雌雄基因组进行全基因组比对,通过 SyRI 软件识别结构差异和同源区域,并用 Plotsr 进行数据可视化。利用 MCScanX 分析染色体共线性,量化性别决定区域的注释差异 。

三、研究结果


(一)基因组组装评估


通过对测序数据的分析,基因组调查显示香港鲇基因组大小约为 884Mb,杂合度为 0.94%,重复序列含量达 45.27%。最终组装的雌性香港鲇基因组大小为 982.84Mb,由 85 个支架组成,contig N50 长度为 36.16Mb,scaffold N50 长度为 37.66Mb,99.60% 的序列成功锚定到 28 条假染色体上,假染色体中缺失碱基显著减少,平均每 100kb 仅含 0.28 个 Ns,相比之前的雄性基因组有明显提升 。

(二)基因组注释结果


重复序列注释表明,转座元件占组装基因组的 44.97%,其中 DNA 转座子、LINEs、SINEs 和 LTRs 分别占 23.62%、6.97%、1.86% 和 10.46%,串联重复序列占 0.6%。共鉴定出 31,182 个非编码 RNA,包括 742 个 miRNA、11,985 个 tRNA、16,314 个 rRNA 和 2,141 个 snRNA 。蛋白质编码基因预测得到 24,849 个基因,平均基因长度为 21,007bp,平均每个基因含 10.22 个外显子,97.30% 的基因获得了功能注释 。

(三)染色体同源分析结果


染色体同源分析发现,雌雄香港鲇基因组存在 257 个同源区域,累积大小为 929.18Mb,占基因组的 94.54%,表明两者相似度较高。同时,检测到 523 处重复(4.74Mb,0.48%)、122 处易位(31.56Mb,3.21%)和 121 处倒位(28.04Mb,2.85%)。在性别决定区域,通过染色体共线性分析量化了两性之间的基因组注释差异 。

四、研究结论与讨论


本研究成功构建了高质量的雌性香港鲇染色体水平基因组组装和注释,与现有版本相比,在基因组连续性、完整性和注释准确性上都有显著提升。该研究成果为深入探究香港鲇性别决定机制提供了更精确的基因组资源,有助于准确识别性别决定基因,为实现单性育种提供理论支持。同时,丰富的基因组注释信息为研究香港鲇重要经济性状的遗传基础提供了便利,对推动其分子育种进程、培育优良品种具有重要意义 。

从进化生物学角度来看,香港鲇高质量基因组的解析有助于深入理解鲇形目鱼类的进化历程,尤其是性别决定系统的演化。研究中揭示的雌雄基因组结构差异,为进一步研究性染色体的进化提供了有价值的线索 。在水产养殖领域,该研究成果可以指导精准育种,通过分子标记辅助选择等技术,加速培育生长快、抗逆性强的优良品种,提高养殖效益和产业竞争力 。此外,研究中采用的多种测序技术和生物信息学分析方法,也为其他物种的基因组研究提供了参考范例,推动了基因组学技术在水产养殖动物研究中的广泛应用 。然而,目前对于香港鲇基因组中部分基因的功能仍有待进一步验证,性别决定基因在实际育种中的应用效果也需要后续研究持续跟进 。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号