整合表观基因组和基因组数据:通过机器学习算法预测奶羊剩余采食量和饲料转化率的新探索

《BMC Genomics》:Integration of epigenomic and genomic data to predict residual feed intake and the feed conversion ratio in dairy sheep via machine learning algorithms

【字体: 时间:2025年04月01日 来源:BMC Genomics 3.5

编辑推荐:

  为解决奶羊饲料效率(FE)评估困难及缺乏相关研究的问题,研究人员开展了通过鉴定差异甲基化区域(DMRs)及评估其预测性能来探索 FE 相关机制的研究。结果发现许多与 FE 相关的基因和通路,且部分模型预测效果良好。这为 FE 研究提供新视角,有重要意义。

  在当今世界,人口持续增长,对高营养食品的需求也与日俱增。预计到 2100 年,全球人口将达到 109 亿。在畜牧业中,饲料效率(Feed Efficiency,FE)成为影响生产效益和可持续性的关键因素。饲料成本在奶牛场可变成本中占比高达 75%,高效的饲料利用不仅能降低成本,还能减少环境影响。然而,目前评估奶羊 FE 仍面临诸多挑战,缺乏统一的计算模型,剩余采食量(Residual Feed Intake,RFI)和饲料转化率(Feed Conversion Ratio,FCR)的遗传力研究较少,且尚未有研究评估表观遗传标记对奶羊 FE 的贡献。因此,开展相关研究对提升奶羊养殖效益和推动畜牧业可持续发展至关重要。
西班牙莱昂大学(Universidad de León)的研究人员为深入探究 FE 相关机制,开展了一项极具意义的研究。他们旨在识别不同 RFI、FCR 及两者共识(Consensus,Cons)组动物间的差异甲基化位点(Differentially Methylated Loci,DMLs)和区域(DMRs),并评估机器学习(Machine Learning,ML)模型利用这些区域的甲基化水平及遗传变异预测 FE 的准确性。该研究成果发表在《BMC Genomics》上。

研究人员采用了多种关键技术方法。首先,选取 21 只西班牙阿萨夫母羊,在其第二个泌乳期进行干物质采食量(Dry Matter Intake,DMI)和产奶量等指标的测定,以此计算 FCR 和 RFI。接着,从牛奶体细胞中提取 DNA,进行全基因组亚硫酸氢盐测序(Whole Genome Bisulfite Sequencing,WGBS),并利用多种软件进行质量控制、序列比对和甲基化位点检测。此外,通过特定的 R 包进行基因注释、基因本体(Gene Ontology,GO)和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集分析。最后,运用多层前馈人工神经网络(deeplearning)、随机森林(Random Forest,RF)和极端梯度提升(extreme gradient boosting,xgboost)等 ML 模型进行预测分析。

研究结果如下:

  1. 饲料效率指标比较:对不同 FE 极端组和营养蛋白限制(Nutritional Protein Restriction,NPR)组的 RFI 和 FCR 进行比较,发现 H-RFI 和 L-RFI 组、H-FCR 和 L-FCR 组之间 RFI 和 FCR 均值差异显著,而 NPR 对这两个指标无显著影响。
  2. 测序及相关分析:通过 WGBS,在 RFI、FCR 和 Cons 组中分别鉴定出 28255、17431 和 9720 个 DMRs,这些 DMRs 注释到的基因数量分别为 12257、9328 和 6723 个,且多数 DMRs 位于基因间和内含子区域。同时,在 RFI、FCR 和 Cons 组中分别鉴定出 59606、43492 和 28103 个变异。
  3. 富集分析:KEGG 通路富集分析显示,RFI、FCR 和 Cons 组分别有 79、56 和 22 条显著富集的通路。其中,16 条通路在三组中共享,如钙信号通路、丝裂原活化蛋白激酶(Mitogen-Activated Protein Kinase,MAPK)信号通路等;33 条通路在 RFI 和 FCR 组中共享,如 Apelin 信号通路、催产素信号通路等。这些通路与激素合成、细胞信号传导、饲料行为等密切相关。
  4. 机器学习模型预测:比较不同 ML 模型对 RFI 和 FCR 的预测性能,发现 RF 预测 mRFI_RFI、mCons_RFI 和 mRFI_RFI + VARs 时,平均均方根误差(Root Mean Squared Error,RMSE)最小,为 0.17;deeplearning 预测 mCons_RFI + VARs 和 mCons_FCR + VARs 时,平均 Spearman 相关系数平方(rho2)最大,为 0.20。最终确定最佳模型为 xgboost 预测 mRFI_RFI(RMSE = 0.10,rho2 = 0.86)和 RF 预测 mCons_RFI + VARs(RMSE = 0.07,rho2 = 0.62)。

研究结论和讨论部分指出,该研究揭示了奶羊不同 FE 组间的表观遗传差异,这些差异与蛋白质消化吸收、激素合成与分泌等重要代谢通路相关。同时,研究表明表观遗传信息和遗传变异具有预测奶羊 RFI 和 FCR 的潜力,尽管样本量有限且存在数据变异性等问题,但为后续研究提供了新的方向和思路。此研究有助于深入理解 FE 的生物学机制,为奶羊遗传选育和营养管理提供重要依据,有望推动奶羊产业的高效、可持续发展。

涓嬭浇瀹夋嵎浼︾數瀛愪功銆婇€氳繃缁嗚優浠h阿鎻ず鏂扮殑鑽墿闈剁偣銆嬫帰绱㈠浣曢€氳繃浠h阿鍒嗘瀽淇冭繘鎮ㄧ殑鑽墿鍙戠幇鐮旂┒

10x Genomics鏂板搧Visium HD 寮€鍚崟缁嗚優鍒嗚鲸鐜囩殑鍏ㄨ浆褰曠粍绌洪棿鍒嗘瀽锛�

娆㈣繋涓嬭浇Twist銆婁笉鏂彉鍖栫殑CRISPR绛涢€夋牸灞€銆嬬數瀛愪功

鍗曠粏鑳炴祴搴忓叆闂ㄥぇ璁插爞 - 娣卞叆浜嗚В浠庣涓€涓崟缁嗚優瀹為獙璁捐鍒版暟鎹川鎺т笌鍙鍖栬В鏋�

涓嬭浇銆婄粏鑳炲唴铔嬬櫧璐ㄤ簰浣滃垎鏋愭柟娉曠數瀛愪功銆�

相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 急聘职位
    • 高薪职位

    知名企业招聘

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号