揭秘玉米 WD40 基因家族:解锁遗传改良新密码,洞察复杂基因组奥秘

【字体: 时间:2025年02月23日 来源:BMC Genomics 3.5

编辑推荐:

  为解决植物 WD40 基因家族种内多样性不明及玉米 WD40 基因缺乏系统研究的问题,研究人员开展玉米 pan-WD40ome 分析。他们构建了相关基因集,明确其结构和功能多样性。该研究为玉米遗传改良提供资源,值得科研读者一读。

  
在奇妙的植物世界里,有一种神秘的蛋白质家族 ——WD40 蛋白家族,它们可是植物生长发育和应对环境变化的 “幕后英雄”。WD40 蛋白家族广泛存在于真核生物中,就像一个个勤劳的小工匠,参与着植物的各种生命活动,从胚胎发育到开花结果,从应对干旱、盐碱等环境压力到抵抗病虫害,都有它们忙碌的身影。

你瞧,在植物的生长过程中,WD40 蛋白家族的成员各司其职。有的参与信号传导,把外界的 “消息” 传递给细胞;有的负责调控细胞周期,让细胞有序地生长和分裂;还有的参与染色质修饰和转录调控,决定哪些基因该 “工作”,哪些基因该 “休息”。比如,WD40 蛋白 TTG1 能和其他转录因子携手,形成一个强大的 “调控团队”,调控植物中黄酮类物质的合成,让花朵绽放出绚丽的色彩,果实变得更加美味可口。

虽然 WD40 蛋白家族如此重要,但是科学家们发现,对这个家族的了解还远远不够。之前的研究大多是基于单个植物基因组进行的,就好像只看到了冰山一角。这就好比在一片广阔的森林里,只观察了一棵大树,却想了解整个森林的全貌,显然是不够的。所以,植物中 WD40 蛋白家族的种内多样性到底是什么样的,我们还不清楚。

而且,玉米作为全球广泛种植的重要作物,既是人类的重要食物来源,也是动物饲料和生物燃料的原料,同时还是研究单子叶植物基因功能的 “明星” 模型。虽然已经知道一些 WD40 基因,如 KRN2、shrek1 等,在玉米的生长发育和环境适应中发挥着重要作用,但对玉米 WD40 基因家族的系统研究却一直没有出现。

为了揭开玉米 WD40 基因家族的神秘面纱,来自相关研究机构的科研人员决心展开深入探索。他们的研究成果发表在了《BMC Genomics》期刊上,论文题目是《Pan-WD40ome analysis in maize reveals its structural and functional diversity and provides candidate genes for genetic improvement》。通过这项研究,他们构建了包含 6849 个 WD40 基因的玉米泛 WD40 组(pan-WD40ome),发现这个泛 WD40 组在纳入约 20 个自交系时基本达到饱和状态。同时,他们还找到了 87 个与 19 个农艺性状、3 个籽粒品质性状和 3 个生物胁迫性状显著相关的 WD40 候选基因。这些发现为玉米及其他复杂基因组作物的基因研究提供了重要的基础,也为玉米的遗传改良带来了新的希望。

科研人员为了完成这项研究,采用了多种关键技术方法。首先,他们从 MaizeGDB 和 Gramene 数据库下载了相关的基因组序列、基因注释信息和蛋白质序列,利用隐马尔可夫模型(HMM)和 BLASTP 搜索等技术,在 26 个玉米嵌套关联作图(NAM)群体的亲本中精准识别出 WD40 基因。然后,通过 OrthoFinder 和 TBtools 软件对这些基因进行分类,将它们划分到不同的同源基因群(OGs)中。接着,利用饱和度分析来确定所识别的 OGs 是否达到饱和状态。此外,借助 ESM - 2 模型预测蛋白质的三维结构,通过染色体定位和共线性分析研究基因在染色体上的分布和变化情况,运用全基因组关联分析(GWAS)数据筛选与性状相关的 WD40 基因。

下面,让我们一起来看看这些科研人员都有哪些神奇的发现吧!

玉米 NAM 群体亲本中 WD40 基因的鉴定和结构特征


科研人员通过一系列复杂的操作,成功在 26 个玉米 NAM 群体亲本中找到了 6849 个含有 WD40 结构域的基因。这些基因在不同亲本中的数量有所差异,最少的有 252 个(Ms71),最多的有 277 个(Oh43)。就像不同的工厂生产的零件数量不同一样,每个亲本里的 WD40 基因数量也各有特点。而且,单个基因中 WD40 结构域的数量也不一样,从 1 个到 13 个不等,其中含有 2 个 WD40 结构域的基因占比最大,达到 28.8%。

除了 WD40 结构域,很多 WD40 基因还带有其他的额外结构域(ADs)。在这 6849 个基因中,有 2224 个(32.5%)编码至少一个来自 80 种不同 Pfam 结构域的 ADs。这些 ADs 在不同亲本中的分布也很有意思,有些 ADs 在所有亲本中都存在,而有些则只在个别亲本中出现。科研人员还发现,用少量的 NAM 群体亲本就能识别出大多数的 ADs,这就好比用少数几个样本就能发现大部分的宝藏一样。

为了看看 WD40 基因在不同物种间的情况,科研人员又在水稻、高粱、谷子和短柄草这四种禾本科植物中进行了同样的分析。结果发现,这些植物中的 WD40 基因和 ADs 数量都比玉米 NAM 群体亲本中的少,这可能是因为玉米在进化过程中经历了独立的全基因组复制事件,就像给玉米的基因库进行了一次 “扩容”。

玉米的泛 WD40 组


WD40 结构域的氨基酸序列保守性有限,而且 WD40 蛋白中 WD40 重复序列的数量变化很大,这给基因的识别工作带来了不小的挑战。科研人员把在 NAM 群体亲本中找到的所有 WD40 基因聚类成 OGs 和单拷贝基因(singletons)。结果发现,大约 4.8%(329/6849)的 WD40 基因是单拷贝基因,剩下的 95.2%(6520/6849)则被分到了 373 个 OGs 中。

科研人员通过抽样分析发现,当随机选择 16 个自交系时,就可以发现 95%(355)的 OGs,这表明他们构建的玉米泛 WD40 组已经基本饱和。他们还根据基因在不同亲本中的存在情况,把 OGs 分为核心(存在于所有 26 个品系中)、近核心(存在于 24 - 25 个品系中)、外壳(存在于 6 - 23 个品系中)和云(存在于 5 个或更少品系中)四类。结果发现,WD40 蛋白中 WD40 重复序列越多,就越保守。这就好比那些经验丰富的老工匠,总是更加可靠一样。

泛 WD40 组中的三维(3D)蛋白质结构


为了探索泛 WD40 组中的结构多样性,以及结构和功能之间的潜在联系,科研人员选择了 373 个代表不同 OGs 的基因和 329 个单拷贝基因,利用 ESMFold 模型预测它们编码的蛋白质的空间结构。

之前的研究告诉我们,典型的 WD40 蛋白复杂结构通常含有一个或多个 β - 螺旋桨结构,每个 β - 螺旋桨由 7 或 8 个由 WD40 重复序列形成的叶片组成,这些结构能帮助 WD40 蛋白与不同的伙伴相互作用。在这项研究中,科研人员发现,58.7%(219/373)的检测到的 OGs 能够形成典型的 β - 螺旋桨结构,而大多数单拷贝基因(88.1%)则无法形成这种结构。这说明单拷贝 WD40 蛋白不仅序列相似性低,空间结构的变化也更大,就像那些特立独行的 “独行侠”。

进一步研究发现,核心和近核心 OGs 中能够形成 β - 螺旋桨结构的比例很高,而云 OGs 中只有 13% 能形成。而且,OGs 中是否存在 ADs 对 β - 螺旋桨的形成影响不大,但含有 ADs 的 OGs 中的蛋白质可能会形成更复杂的 3D 结构。此外,WD40 重复序列较多的 OGs 更有可能形成 β - 螺旋桨结构。这一系列发现让我们对 WD40 蛋白的结构有了更深入的认识。

WD40 基因的基因组景观


科研人员把 26 个玉米 NAM 群体亲本中的 WD40 基因序列锚定到各自的基因组上,发现 6849 个 WD40 基因中,有 6815 个位于玉米的 10 条染色体上,剩下的 34 个在未组装的重叠群上。他们根据基因的物理位置和共线性关系,把这些基因分成了 493 个不同的区块。结果发现,不到一半的区块(201 个,40.8%)在所有 26 个品系中都含有基因,这说明 WD40 基因家族存在很大的变异。

他们还发现,非保守区块中 WD40 功能结构域的缺失主要是由于基因组序列和转录本的变异,其中最常见的基因组序列变异是大的结构变异(SVs)。在基因复制方面,串联重复事件相对较少,而片段重复事件可能是一些 OGs 中 WD40 基因多拷贝产生的主要机制。有趣的是,在云 OGs 中,超过一半(38/61)的 79 个 WD40 基因的完整编码区插入到了 Helitron 转座子所在的基因组区域,这可能导致了基因的重新定位和基因组的进化。

WD40 基因与农艺、籽粒品质和生物胁迫性状的关联


科研人员收集了之前利用 NAM 群体对 25 个性状(19 个农艺性状、3 个籽粒品质性状和 3 个生物胁迫性状)进行全基因组关联分析(GWAS)的结果,通过筛选,确定了 122 个基因 - 性状关联。其中,58 个 WD40 基因与单个性状显著相关,29 个与两个或三个性状显著相关。

虽然大部分与性状显著相关的 WD40 基因在玉米中的功能还不清楚,但科研人员利用玉米多组学整合网络图谱 MaizeNetome,找到了这些基因编码的蛋白质的潜在相互作用蛋白,并构建了蛋白质 - 蛋白质相互作用(PPI)网络。通过这个网络,他们发现 WD40 蛋白和它们的相互作用伙伴形成的复合物主要参与蛋白质 / RNA 生物合成、囊泡运输、染色质组织等分子途径,这表明 WD40 基因在玉米的生长发育和环境相互作用中起着多样化的作用。

在这项研究中,科研人员构建了玉米泛 WD40 组,发现它在纳入约 20 个自交系时基本饱和。通过对蛋白质结构域架构的分析,揭示了 WD40 蛋白的种内变异主要源于 WD40 重复序列较少的蛋白质和特定的额外结构域。对 WD40 蛋白进行分类和结构预测,展现了其结构和功能的多样性,核心和近核心 OGs 能够形成典型的 β - 折叠结构,说明它们的功能更保守。

同时,研究还发现基因复制和 Helitron 转座子引起的基因易位在玉米 WD40 基因家族的扩增中发挥了重要作用。此外,鉴定出的 87 个与多种性状相关的 WD40 候选基因,以及构建的 PPI 网络,都为玉米的遗传改良提供了宝贵的资源。

这项研究就像一幅全景图,为我们展示了玉米中 WD40 基因家族的多样性和复杂性。它为玉米和其他复杂基因组作物中大型基因家族的鉴定和功能表征奠定了基础,让我们在探索植物基因奥秘的道路上又前进了一大步。未来,科学家们可以根据这些发现,利用突变分析、过表达、基因编辑等技术,进一步研究这些 WD40 基因的功能和分子机制,从而更好地改良玉米品种,提高玉米的产量和品质,为农业生产带来新的突破。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
生物通微信公众号
微信
新浪微博

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号