编辑推荐:
为探究功能序列变异对奶牛泌乳性状基因组预测准确性的影响,研究人员开展了对比五类功能变异与通用单核苷酸多态性(SNP)芯片标记的研究。结果显示功能变异可提高预测准确性,这为开发更高效的 SNP 芯片提供了依据。
在动物和植物育种领域,基因组选择(Genomic selection)已成为一种重要手段。它借助大量分散于基因组的标记来估算个体遗传价值,也就是基因组估计育种值(Genomic Estimated Breeding Value,GEBV) 。相较于传统基于系谱的方法,基因组选择在预测年轻动物遗传价值时准确性更高,这有助于缩短世代间隔,加快遗传进展。不过,目前使用的通用 SNP 芯片存在一些局限性。一方面,传统 SNP 芯片标记可能无法精准定位与性状相关的因果变异;另一方面,全基因组序列数据虽包含大量信息,但因其成本高、计算需求大,且在标记效应估计时标准误差大,容易出现错误,导致预测准确性提升有限。所以,寻找更有效的遗传标记,提升基因组预测准确性,成为了育种领域亟待解决的问题。
为了攻克这些难题,来自新西兰梅西大学 AL Rae 遗传学与育种中心、AgResearch Limited 的 Invermay 农业中心、LIC、奥克兰大学生物科学学院等机构的研究人员,进行了一项关于奶牛泌乳性状基因组预测的研究。该研究成果发表在《Genetics Selection Evolution》上。
研究人员运用了多种关键技术方法。首先,从商业收集的牛群测试记录中获取 494,963 头奶牛的首次泌乳表型数据,并调整非遗传效应以构建产量偏差(YD)数据。其次,通过特定方法从 166,664 头奶牛的推算序列变异中提取功能变异基因型。在数据分析阶段,使用 Markov 链蒙特卡罗(MCMC)方法和 BayesCpi 模型进行基因组评估,并采用五折交叉验证来评估各类功能变异的性能。
研究结果如下:
- GWAS 标记的效果:研究发现,与从当前 SNP 芯片中随机选择的相同数量的 SNP 相比,1124 个通过全基因组关联研究(GWAS)选择的功能变异显著提高了所有五个评估性状的基因组预测准确性。其中,脂肪百分比的预测准确性提高了 57.77%,蛋白质百分比提高了 48.28%,产奶量提高了 15.36%,脂肪产量提高了 13.83%,蛋白质产量提高了 3.18%1。
- RNA-seq 标记的效果:RNA 测序(RNA-seq)功能变异同样显著提升了基因组预测准确性。例如,外显子表达定量性状位点(eeQTL)变异使脂肪百分比的预测准确性提高了 12.82%,蛋白质百分比提高了 7.26%,产奶量提高了 6.40%,脂肪产量提高了 4.36%,蛋白质产量提高了 0.72%。不过,剪接效率定量性状位点(seQTL)变异对脂肪产量的预测准确性有负面影响,但对蛋白质百分比的预测准确性提高了 18.47%23。
- 其他功能变异的效果:组蛋白修饰染色质免疫沉淀测序(ChIP-seq)和转座酶可及染色质测序(ATAC-seq)功能变异对基因组预测准确性的影响各不相同。其中,等位基因特异性结合定量性状位点(asbQTL)变异对所有五个性状的预测准确性都有提升,而 ChIP-seq QTL 变异对蛋白质产量的预测准确性略有下降,但对其他性状有一定提升。ATAC-seq 功能变异对百分比性状有一定的提升作用,但对产量性状的预测准确性有轻微下降。编码变异对部分性状的预测准确性有提升,对脂肪产量和蛋白质产量的预测准确性则有所降低45。
- 综合分析:当将不同功能变异组合时,“GWAS 和 eeQTL”“GWAS、eeQTL 和 asbQTL”“GWAS、eeQTL、asbQTL 和 aseQTL” 等组合在大多数性状上的基因组预测准确性与当前 32,595 SNP 芯片相当甚至更高,且使用的 SNP 数量更少。将所有功能变异组合在一起时,脂肪百分比、蛋白质百分比、产奶量和脂肪产量的预测准确性有所提高,但蛋白质产量略有下降67。
研究结论和讨论部分指出,该研究表明功能变异相较于通用 SNP 面板能有效提高基因组预测准确性,尤其是百分比性状。精心选择的功能变异组合,如包含 16k 变异的组合,可实现与使用两倍大小标准面板(32.6k)相当的预测准确性,这为开发更高效、针对特定性状的 SNP 面板提供了可能。然而,使用功能变异也面临一些挑战,如测序和推算过程中的误差可能会抵消预测准确性的提升,开发特定功能变异芯片的成本较高,且该面板在不同性状和品种中的适用性有待进一步研究。未来研究应探索如何将功能变异整合到现有 SNP 面板中,以平衡预测精度和综合性状覆盖的需求。这项研究为奶牛育种中基因组预测技术的改进提供了重要参考,有助于推动奶牛育种行业的发展,提高奶牛养殖的经济效益和生产效率。