构建印度瘤牛泛基因组:解析遗传多样性,推动牛类基因组学发展

【字体: 时间:2025年04月14日 来源:Communications Biology 5.2

编辑推荐:

  为解决单一参考基因组难以全面捕获印度瘤牛遗传变异的问题,研究人员开展了印度瘤牛泛基因组构建研究。通过对 7 个品种 68 个个体测序,识别出 13,065 个非参考新序列(NRNS)。该研究提升了读长映射准确性,对深入理解瘤牛基因组学意义重大。

  印度瘤牛,作为印度次大陆上的独特牛种,在恶劣环境中展现出强大的适应能力,对热带疾病和害虫具有抵抗力,还能以低质量草料维持生长,是极具价值的遗传资源。然而,在基因研究领域,传统的单一参考基因组却遇到了难题。就像用一张地图去标注世界上所有的地方,总会有遗漏。单一参考基因组无法完整涵盖印度瘤牛丰富的遗传变异信息,这就如同在探索一座宝藏时,只找到了其中一小部分宝藏,还有大量珍贵的遗传信息等待发掘。
为了填补这一空白,深入挖掘印度瘤牛的遗传奥秘,来自国家动物生物技术研究所等机构的研究人员踏上了探索之旅,开展了构建印度瘤牛泛基因组的研究。这项研究成果发表在《Communications Biology》杂志上,为牛类基因组学研究带来了新的曙光。

研究人员采用了多种关键技术方法来推动研究进展。首先是短读长测序技术,对代表 7 个不同印度瘤牛品种的 68 个个体进行全基因组测序,获得大量的测序数据。之后,运用自主开发的 PanGenome Analysis(PanGA)管道,从海量数据中识别非参考新序列(NRNS)。同时,结合多种生物信息学工具,如 BLAST、RepeatMasker 等,进行序列比对、基因注释和进化分析等工作 。

下面来详细看看研究结果:

  1. 瘤牛基因组测序:对 68 头瘤牛个体进行全基因组测序,经过严格的数据预处理,去除低质量读段后,保留了 437.9 亿高质量读段,测序数据量达到约 6062Gb,平均覆盖深度约为 33X。
  2. NRNS 识别:利用 PanGA 管道对预处理后的数据进行分析,从瘤牛群体中识别出 13,065 个 NRNS,总长度为 40,973,925bp。这些 NRNS 大小不一,N50 为 4629bp 。
  3. 与已发表泛基因组及其他基因组组装的比较:与已发表的牛泛基因组相比,该研究中识别出的 NRNS 与其他研究的重叠较少。例如,与 Zhou 等人 2022 年研究的匹配 NRNS 序列仅 183 条,与 Dai 等人 2023 年研究的匹配 NRNS 序列占本研究 NRNS 总量的 4.1%。同时,NRNS 与不同品种牛的基因组组装比对也有不同程度的匹配 。
  4. NRNS 在样本中的存在与否分析:在识别出的 13,065 个 NRNS 中,8402 个序列在至少两个个体中出现,4663 个为私有插入(仅在一个个体中发现)。不同品种间存在共有和特有的 NRNS,但样本量可能影响相关结论 。
  5. NRNS 在参考基因组上的定位:将 NRNS 映射到参考基因组,发现只有 17.61%(2302 个)的 NRNS 成功定位到染色体上,多数未定位。含有串联重复(TRs)的 NRNS 定位更困难 。
  6. NRNS 的转录潜力:通过从头预测和基于证据的方法预测 NRNS 的转录结构,共预测出 1856 个肽段和 7991 个转录本,涉及 1453 个非冗余基因,可用于下游功能分析 。
  7. 基因本体(GO)富集分析:对与 NRNS 相关的基因进行 GO 富集分析,发现其在细胞黏附、细胞间信号传导、突触功能等生物学过程、细胞组分和分子功能相关的 GO 术语中显著富集,暗示 NRNS 在细胞通讯、组织发育和免疫反应等方面有重要作用 。
  8. 数量性状基因座(QTL)分析:分析 NRNS 基因与 QTL 的关联,发现 500 个基因位于重要 QTL 区域,可关联到 2773 个 QTL,其中与牛奶性状相关的 QTL 最多(33.2%),这表明 NRNS 可能对瘤牛的经济性状有重要影响 。
  9. NRNS 中重复序列注释:NRNS 数据集里 39.6% 为重复序列,主要是长散在核元件(LINEs,23.5%)和短散在核元件(SINEs,9.7%),与婆罗门参考基因组相比无重复偏差 。
  10. 进化分析:研究发现 40.44% 的 NRNS 在 Bos 属姐妹物种中存在,表明部分瘤牛泛基因组具有祖先起源。与其他 Bovidae 家族成员相比,共享的 NRNS 较少,且与物种进化距离相关 。
  11. 评估泛基因组作为参考的效用:将短读长数据分别比对到婆罗门参考基因组和构建的泛基因组,发现泛基因组的映射比率更高,能减少假阳性单核苷酸多态性(SNP)的调用,还能识别出更多新的 SNP 。

综合研究结论和讨论部分,这项研究意义重大。通过构建印度瘤牛泛基因组,全面解析了瘤牛的基因组景观,揭示了 NRNS 在瘤牛基因组中的重要地位。NRNS 不仅具有编码潜力,还在基因区域广泛分布,可能对瘤牛的表型多样性产生重要影响。同时,研究发现大量 NRNS 具有祖先起源,进一步强调了泛基因组在捕获遗传变异方面的优势。此外,构建的泛基因组在提高读长映射准确性、减少假阳性 SNP 以及发现新 SNP 等方面表现卓越,为后续深入开展瘤牛基因组研究、遗传改良和品种选育提供了有力支持,也为其他物种的泛基因组研究提供了重要参考 。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号