青藏高原220头藏绵羊全基因组变异图谱揭示高原适应性遗传机制
《Scientific Data》:Whole-genome variant of 220 Tibetan sheep from the Qinghai-Tibetan Plateau
【字体:
大
中
小
】
时间:2025年12月07日
来源:Scientific Data 6.9
编辑推荐:
本研究针对藏绵羊生产效益低但肉质优良的特点,通过对11个不同海拔种群220头藏绵羊进行平均6.20X深度的全基因组测序,获得了约2110万个高质量SNPs。该数据集为解析藏绵羊高原适应性遗传机制、加速其遗传改良提供了重要资源,对推动高原畜牧业发展具有重要意义。
在雄伟的青藏高原上,生活着一种特殊的绵羊品种——藏绵羊(Ovis aries)。作为中国三大原始绵羊品种之一,它们在这片平均海拔超过4000米的高原上已经生存了数千年,完美适应了高寒、低氧、强紫外线等极端环境条件。藏绵羊不仅具有粗饲料耐受力强、抗病能力突出、觅食能力优秀等生存优势,其绿色有机羊肉更是深受消费者青睐。然而,由于高原环境的制约,藏绵羊长期陷入"低水平发展、低效率生产"的困境,产量难以满足市场需求,这成为制约当地牧区经济高质量发展的重要瓶颈。
虽然前期研究已经揭示了藏绵羊基因组的基本特征,并对EPAS1、EGLN1等高原适应性基因有了初步认识,但高原适应性作为复杂的多基因性状,其遗传机制尚未完全阐明。更重要的是,不同海拔分布的藏绵羊种群可能存在各自独特的本地适应机制,而表型数据和基因组数据的缺乏严重阻碍了通过遗传改良提升藏绵羊重要经济性状的进程。为了突破这一瓶颈,研究人员迫切需要更全面、更系统的基因组数据资源。
正是在这一背景下,中国农业科学院兰州畜牧与兽药研究所的曾奎鲁研究员团队在《Scientific Data》上发表了最新研究成果。该研究对来自青藏高原11个不同海拔种群(海拔范围2887-4643米)的220头藏绵羊进行了全基因组测序分析,构建了迄今为止最全面的藏绵羊基因组变异图谱,为深入解析这一珍贵物种的遗传多样性和高原适应性机制提供了宝贵的数据支撑。
研究团队采用了一系列先进的技术方法开展此项工作。首先从11个藏绵羊种群中采集了220个血液样本,使用TIANGEN血液基因组DNA提取试剂盒提取高质量DNA。随后利用Illumina HiseqX10 PE150平台进行全基因组测序,平均测序深度达到6.20X。使用fastp软件进行数据质控后,通过BWA-MEM算法将高质量测序reads比对到藏绵羊参考基因组(GCA_017524585.1)。变异检测采用GATK流程,经过严格过滤后获得高质量SNPs,并使用ANNOVAR进行功能注释。为评估数据可靠性,研究人员还通过Ti/Tv比值、杂合/纯合比值等指标进行了严格的质量验证。
研究团队精心选择了11个具有代表性的藏绵羊种群,这些种群分布在青藏高原的不同地理区域,海拔跨度从2887米到4643米,涵盖了甘肃、青海、西藏三个省区。每个种群采集20个无亲缘关系的成年个体样本,共计220个样本。这种广泛的地理采样策略确保了研究结果能够全面反映藏绵羊种群的遗传多样性特征,为研究不同海拔适应机制提供了理想的材料基础。
技术验证结果显示,本研究获得的测序数据质量优异。每个个体获得的测序数据量在13.78-24.29Gb之间,平均为16.75Gb;Q30碱基比例平均达到91.86%,表明测序错误率极低。基因组覆盖度在5.10X-9.00X之间,平均为6.20X,这一深度虽然低于通常认为的"金标准"30X深度,但在大样本量的情况下(本研究n=220)已足够准确检测遗传变异。数据质控指标显示,重复reads率平均为22.84%,唯一比对reads率高达77.16%,平均GC含量为44.60%,这些指标均表明数据质量可靠,无外源基因组污染。
通过GATK流程,研究团队初步检测到235,803,940个原始SNPs,经过严格的质量过滤(包括QD<2.0、FS>60.0、MQ<40.0等参数),最终获得21,099,381个高质量SNPs。特别值得注意的是,通过与dbSNP和iSheep数据库的比较,发现有4,579,420个SNPs(21.704%)是首次报道的新变异,这反映了先前研究中藏绵羊品种的代表性不足。变异检测的准确性通过Ti/Tv比值(2.56)得到验证,该比值处于正常范围内,说明SNP calling准确性较高。杂合/纯合比值为0.92,低于人类基因组中的预期值(2.0),可能反映了藏绵羊种群中存在一定程度的近交现象。
对SNPs在染色体上的分布分析显示,平均每125.62bp就有一个SNP,其中性染色体上的SNP密度最高,常染色体上的分布相对均匀。功能注释结果表明,大多数SNPs分布在内含子和基因间区,这与哺乳动物基因组的普遍特征一致。不同种群间的比较显示,Tao羊(TS)群体的多态信息含量(PIC)最高,而Zashijia羊(ZSJ)群体最低;天峻白藏羊(WT)群体的核苷酸多样性(π)最高,Zashijia羊(ZSJ)群体最低,这些差异反映了不同种群遗传背景的多样性。
本研究产生的全基因组测序数据(FASTQ格式)已存入NCBI Sequence Read Archive( accession number PRJNA1138910),最终的VCF文件已存入European Variation Archive( accession number PRJEB10094218),所有分析代码均通过GitHub(https://github.com/luzengkui/sheep_NGS_01)公开共享。这种完整的数据共享策略确保了研究结果的可重复性和后续研究的可及性。
这项研究的意义不仅在于提供了大规模的藏绵羊基因组数据资源,更重要的是为理解这一特殊物种的高原适应机制奠定了坚实基础。通过对不同海拔种群的比较基因组学分析,未来研究可以更精确地识别与高原适应性相关的遗传标记和候选基因,为藏绵羊的基因组辅助育种提供理论依据。同时,研究中发现的大量新SNPs为藏绵羊的遗传多样性研究提供了新的线索,有助于揭示这一物种在极端环境下的进化历程。
从更广阔的视角来看,这项研究展示了低深度全基因组测序在大样本群体遗传学研究中的有效性和经济性,为其他家畜物种的基因组研究提供了可借鉴的技术路线。随着基因组学技术的不断发展和成本的降低,类似的研究策略有望在更多非模式生物中推广应用,加速我们对生物适应机制的理解,并为物种保护和遗传改良提供科学支持。
藏绵羊作为青藏高原生态系统的重要组成部分和当地牧民的重要生计来源,其遗传改良和可持续发展具有重要的经济价值和生态意义。本研究提供的基因组资源将有力推动藏绵羊育种工作的精准化和高效化,为高原畜牧业的可持续发展注入新的活力。随着后续功能基因组学研究的深入,我们有望更全面地揭示藏绵羊这一珍贵遗传资源的价值,为应对高原环境挑战、保障肉类供给安全提供新的解决方案。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号