印度本地牛基因组揭示结构变异热点与免疫相关遗传多样性
《NAR Genomics and Bioinformatics》:Genome assemblies of Indian desi cattle reveal hotspots of rearrangements and immune-related genetic diversity
【字体:
大
中
小
】
时间:2025年12月11日
来源:NAR Genomics and Bioinformatics 2.8
编辑推荐:
本研究针对印度本地牛遗传资源缺乏高质量基因组参考的现状,通过对吉尔牛、坎克雷吉牛、红辛迪牛、萨希瓦尔牛和塔帕卡牛五个重要品种进行10x Genomics链接读长测序和de novo组装,构建了染色体水平的基因组。研究发现这些品种与婆罗门牛参考基因组存在87%-95%的同线性,鉴定出6622个结构重排热点区域(HOT regions),这些区域富含免疫相关基因(如MHC、NKC、LRC),并与牛奶产量、结核病抗性等重要性状QTL显著重叠。该研究为理解印度本地牛的适应性进化提供了重要基因组资源,对遗传改良和疾病抗性育种具有重要价值。
印度拥有全球最大的牛群数量,超过1.92亿头,其中包括50个公认的本土瘤牛品种。这些被称为"desi"的本地牛经过几个世纪的传统畜牧实践,已进化出对恶劣环境的适应能力、对热带疾病和寄生虫的抵抗力,以及依靠劣质粗饲料生存的能力。然而,尽管这些品种具有重要的农业经济价值,但在基因组研究方面却相对滞后。特别是在研究开始之时,尚无印度本地牛品种的染色体水平基因组组装公开可用,这严重限制了对这些珍贵遗传资源的深入理解和利用。
为了填补这一空白,研究人员对五个重要的印度奶牛品种——吉尔牛、坎克雷吉牛、红辛迪牛、萨希瓦尔牛和塔帕卡牛——进行了全面的基因组学研究。这些品种对应印度西北部的三个邻近农业气候区,是印度牛奶产量最高的本地品种。研究采用10x Genomics Chromium链接读长技术对每个品种进行约100x覆盖度的测序,通过Supernova组装器进行de novo组装,并利用ARCS和GapCloser进行组装优化。获得的de novo组装大小在2.70-2.78 Gb之间,与婆罗门牛参考基因组(2.7 Gb)相当。其中萨希瓦尔和红辛迪牛的组装质量尤为突出,90%的基因组分别仅用56和86个scaffolds组装完成。
通过参考基因组引导的scaffolding方法,研究人员进一步将组装提升到假分子水平,覆盖了93.3%-96.7%的基因组。BUSCO(Benchmarking Universal Single-Copy Orthologs)评估显示所有组装的完整性均达到94.1%-95.5%,表明这些基因组具有高质量和完整性。基因注释通过Liftoff工具将婆罗门牛基因组的注释转移到五个新品种基因组,发现共有18675个基因在所有品种中共享,同时每个品种也含有独特的基因内容。
研究的关键技术方法包括:从代表性个体采集血液样本并提取高分子量DNA,使用10x Genomics Chromium技术构建文库并在Illumina HiSeq X系统测序;利用Supernova组装器进行de novo组装,ARCS进行scaffolding优化;采用RagTag进行参考基因组引导的假分子构建;通过BUSCO评估组装完整性,Liftoff进行基因注释,RepeatMasker进行重复序列分析;使用SyRI(Synteny and Rearrangement Identifier)进行全基因组同线性和结构变异分析,计算同线性多样性(πsyn)识别重排热点区域;进行基因本体(GO)富集分析和数量性状位点(QTL)数据库比对。
De novo genome assembly of five indigenous cattle breeds
研究人员成功对五个印度本地牛品种进行了de novo基因组组装,组装大小在2.70-2.78 Gb之间,与婆罗门牛参考基因组高度一致。萨希瓦尔和红辛迪牛的组装质量最佳,90%的基因组分别仅用56和86个scaffolds组装完成,N50 scaffold长度分别达到65.7 Mb和45.8 Mb。BUSCO分析显示所有de novo组装的完整性均超过93%,与参考基因组的95.7%相当,证实了组装的高质量。
Generation of reference-guided assemblies
通过以婆罗门牛基因组为模板的参考引导组装,基因组的假分子覆盖率提升至93.3%-96.7%,其中萨希瓦尔(96.71%)和红辛迪(96.58%)的覆盖率最高。这一改进不仅提高了组装的连续性,还改善了BUSCO统计结果,注释率达到94.0%-95.5%,为下游分析提供了更可靠的基因组资源。
Liftover genes in assemblies
基因注释分析显示,从婆罗门牛基因组成功转移了大多数注释基因(20846个),其中18675个基因在所有五个品种中共享。每个品种还含有独特的基因内容,如萨希瓦尔有33个特有基因,红辛迪有62个特有基因。这些基因差异可能反映了各品种在适应不同环境过程中积累的基因组变异。
Repetitive element composition in genome assemblies
重复序列分析表明,印度本地牛基因组约47%由重复元件组成,其中长散在重复序列(LINEs)最为丰富(约27%),其次是短散在重复序列(SINEs)、长末端重复序列(LTRs)和DNA元件。这种分布与婆罗门牛参考基因组及其他哺乳动物的重复序列格局一致,反映了典型的哺乳动物基因组特征。
Introgressed regions in Bos indicus genomes
通过比较三个Bos taurus和六个Bos indicus基因组的SNP密度,研究人员鉴定了59个推定渗入区域。婆罗门牛含有最多的渗入区域(38个),而纯种印度本地牛如红辛迪(8个)和萨希瓦尔(5个)则较少。这些渗入区域富含与牛奶生产相关的QTL,占总鉴定QTL的61.94%,反映了历史上为提高产奶性能而进行的育种选择。
Syntenic and rearranged regions in desi cattle
比较基因组分析显示,五个品种与婆罗门牛参考基因组存在87%-95%的同线性。每个基因组含有19.8-153.2 Mb的结构重排区域,包括127-147个倒位(2.6-5.3 Mb)、970-1572个多态性重复(1.8-6.4 Mb)以及1717-10111个易位(14.9-144.0 Mb)。其中红辛迪牛X染色体上发现了一个2.8 Mb的大规模倒位,是所有品种中最大的结构变异。
Quantification of genome collinearity and synteny diversity
研究人员首次在印度本地牛中应用同线性多样性(πsyn)参数进行基因组比较,发现10643个完美共线性区域(πsyn=0),覆盖87.3 Mb,包含6381个基因。这些基因中约41%与保守的哺乳动物直系同源基因匹配,表明共线性区域在物种水平上高度保守。相反,重排区域显示更高的πsyn值,表明这些区域存在更复杂的基因组变异。
Hotspots of rearrangements analysis
通过5 kb滑动窗口分析,研究人员鉴定了6622个重排热点区域(HOT regions),定义为πsyn值超过0.5的基因组区段,总跨度55.2 Mb。这些区域具有较高的转座元件比例和较低的基因密度,但仍包含3133个基因,包括2794个蛋白质编码基因。
Functional characterization of genes in HOT regions
功能分析显示,HOT区域中的基因显著富集于免疫相关生物过程,如内源性抗原加工和呈递(GO:0019883)、MHC class I介导的肽抗原呈递(GO:0019885)和T细胞介导的细胞毒性调节(GO:0001914)。QTL分析发现,HOT区域中58%的蛋白质编码基因位于已知QTL区域内,其中32.8%与牛奶相关性状有关,还包括牛肉品质、 carcass特性和健康性状(如牛结核病易感性)的QTL。
Characterization of immune gene clusters and synteny diversity
研究人员在婆罗门牛基因组中定位了三个主要免疫基因簇(IGCs):23号染色体上的主要组织相容性复合体(MHC,29.40-29.65 Mb)、18号染色体上的白细胞受体复合体(LRC,2.42-2.78 Mb)和5号染色体上的自然杀伤细胞复合体(NKC,20.81-21.07 Mb)。这些IGCs完全位于HOT区域内,基因拷贝数在不同品种间存在变异,可能通过影响基因表达水平和受体多样性来调节免疫功能。
本研究成功构建了五个印度本地牛品种的高质量基因组,首次在序列水平上全面揭示了这些品种的基因组同线性和结构变异特征。研究发现印度本地牛基因组中存在大量结构重排,特别是鉴定出的6622个HOT区域,这些区域富含免疫相关基因并与重要性状的QTL重叠,为理解印度本地牛的疾病抗性和环境适应性提供了分子基础。免疫基因簇完全位于HOT区域内的发现尤为引人注目,表明这些区域在生成免疫多样性方面发挥关键作用。该研究不仅为印度本地牛的遗传改良和育种提供了宝贵的基因组资源,也为理解哺乳动物基因组进化、特别是免疫相关基因的演化机制提供了重要见解。这些高质量的基因组组装将作为未来遗传改良、疾病抗性和环境适应性研究的重要基础,对保护和发展印度珍贵的牲畜遗传资源具有深远意义。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号