全基因组关联研究及用于菠菜表型分析中高度性状的基因组预测
《Frontiers in Plant Science》:Genome-wide association study and genome prediction of tallness trait in spinach phenotyping
【字体:
大
中
小
】
时间:2025年09月30日
来源:Frontiers in Plant Science 4.8
编辑推荐:
菠菜植株高度遗传解析及基因组预测研究。通过307份USDA种质资源全基因组重测序数据,采用GWAS和GP模型筛选出10个显著关联SNP,分布在1、2、4、5、6号染色体。候选基因涉及RNA加工(LSm5)、代谢调控(Epiesterase)、F-box蛋白(调控激素信号)及线粒体功能(LETM1)。rrBLUP模型在10个SNP标记下r值达0.55,验证了GWAS-GP整合策略在机械收获优化育种中的应用潜力。
植物高度是菠菜(*Spinacia oleracea* L.)生产中的关键农艺性状,对机械收获效率和整体产量有着深远影响。本研究通过对307个来自美国农业部(USDA)的菠菜种质资源进行表型和基因型分析,旨在揭示植物高度的遗传基础并探索其在菠菜育种中的应用潜力。通过全基因组重测序获得了15,058个单核苷酸多态性(SNP),并采用多种统计模型进行全基因组关联分析(GWAS),包括广义线性模型(GLM)、混合线性模型(MLM)、多位点混合模型(MLMM)、固定和随机模型循环概率统一(FarmCPU)以及贝叶斯信息与连锁不平衡迭代嵌套关键法(BLINK)等模型。研究结果表明,有10个SNP与植物高度显著相关,分布在6条染色体上。这些SNP的发现不仅为理解菠菜植物高度的遗传结构提供了重要线索,也为基于标记的育种策略提供了理论依据,从而有助于提升农业管理和经济效益。
菠菜作为一种高营养价值的绿叶蔬菜,近年来在全球范围内受到越来越多消费者的青睐。其富含多种维生素、矿物质、抗氧化物以及生物活性化合物,如类胡萝卜素和黄酮类物质。然而,菠菜的种植与管理面临诸多挑战,其中植物高度的优化尤为关键。较高的植物高度不仅有利于机械收割设备的操作,还能减少因收割不完全而导致的产量损失。同时,较高的植物也更容易适应不同环境条件,但过高的植物可能面临倒伏风险,这在恶劣天气条件下尤为突出。因此,如何在提升植物高度的同时避免倒伏问题,是菠菜育种过程中需要平衡的重要课题。
植物高度在菠菜中是一种多基因性状,受多个遗传因素的共同调控。传统的数量性状位点(QTL)分析方法虽然在发现大效应位点方面具有优势,但在检测小效应位点上存在局限性。这促使研究者转向更先进的全基因组分析方法,如GWAS和基因组预测(GP)。GWAS能够识别与表型变异相关的多个SNP位点,为遗传改良提供更全面的视角。GP则利用全基因组标记预测遗传潜力,从而加快育种进程。在菠菜中,虽然GS方法已应用于其他作物,但其在菠菜中的应用仍处于初步探索阶段。
本研究中使用的数据来源于USDA的菠菜种质资源库,涵盖了来自30个国家的307个种质资源。这些种质资源通过温室环境下的实验进行表型测定,植物高度在55天后进行测量,记录了从4.5厘米到16.2厘米的广泛变异。这种高度的多样性不仅反映了菠菜种质资源的丰富性,也为GWAS研究提供了良好的基础。此外,通过主成分分析(PCA)和系统发育树的构建,研究人员进一步揭示了菠菜种质资源的遗传结构,发现至少存在两个主要的遗传群体,并且在某些情况下还存在三个子群体。这些遗传结构的识别有助于更精准地定位与植物高度相关的基因位点。
GWAS分析采用多种统计模型,包括GLM、MLM、MLMM、FarmCPU和BLINK。这些模型在检测SNP与植物高度之间的关联性方面表现出一定的差异。其中,SOVchr6_8139833在三个模型中均表现出显著的关联性,且在MLM模型中达到较高的LOD值(6.92和5.47),并具有较高的遗传变异解释率(PVE值高达26.91%)。这一发现表明,该SNP可能是植物高度调控的关键基因位点之一。此外,SOVchr4_188084338在BLINK模型中也表现出显著的关联性,而其他模型的关联信号则较弱,这提示该SNP可能在特定条件下才表现出其调控作用。通过对这些SNP的分析,研究人员识别出多个候选基因,包括与RNA加工、代谢通路和线粒体功能相关的基因。这些基因在不同作物中已被证实与植物高度调控有关,因此在菠菜中也具有潜在的调控作用。
基因组预测模型在本研究中被用于评估这些SNP在预测植物高度方面的有效性。研究采用多种GP模型,包括贝叶斯方法(如BA、BB、BL和BRR)以及线性回归模型(如rrBLUP、随机森林和支持向量机)。结果表明,使用随机选择的SNP集合时,所有模型的预测准确率(r值)均较低,表明基因组预测在这一性状上仍面临一定挑战。然而,当使用GWAS鉴定出的SNP集合时,预测准确率显著提高,尤其是当使用10个SNP时,平均r值达到0.50。这说明,这些SNP具有较高的预测能力,可能成为未来菠菜分子育种的重要工具。
研究还进一步探讨了不同预测策略对植物高度预测效果的影响。例如,在跨群体预测中,使用GWAS鉴定的SNP集合时,预测准确率明显下降,平均r值仅为0.12。这表明,虽然这些SNP在本研究群体中具有较高的预测能力,但在应用于其他群体时可能存在一定的局限性。这可能与群体间的遗传多样性差异有关,也提示在进行基因组选择(GS)时,需要充分考虑群体间的遗传背景。此外,当使用所有15,058个SNP时,预测准确率有所提升,但仍未达到理想水平。这说明,虽然增加SNP数量有助于提高预测精度,但过高的标记密度可能带来计算复杂性和数据冗余的问题。
在GWAS和GP模型的结合应用中,研究人员发现,rrBLUP和贝叶斯模型(BA、BB、BL和BRR)在使用GWAS鉴定的SNP集合时表现出较高的预测能力。这可能是因为这些模型在处理多基因性状时,能够更有效地捕捉加性遗传变异,从而提高预测准确性。相比之下,其他模型如随机森林和支持向量机的预测效果略逊一筹,这可能与其对非线性关系的处理能力有关。此外,研究还发现,预测准确率在不同预测策略中存在差异,例如,在自预测(使用训练集预测训练集)和跨预测(使用训练集预测验证集)中,预测效果有所不同。这表明,预测模型的选择和应用策略需要根据具体的育种目标进行调整。
本研究的成果为菠菜的分子育种提供了重要的理论支持和实践指导。通过GWAS,研究人员不仅发现了多个与植物高度显著相关的SNP位点,还识别出多个候选基因,这些基因可能在植物高度调控中发挥关键作用。此外,GP模型的应用表明,虽然预测准确率仍然有限,但通过合理选择SNP集合和优化模型参数,可以提高预测效率。这些发现对于未来菠菜育种具有重要意义,尤其是在提升机械收获效率和优化作物性状方面。研究还指出,基因组预测在不同作物中的应用效果存在差异,这提示在实际应用中需要结合具体作物的遗传背景和育种目标进行模型选择和参数调整。
总的来说,本研究通过GWAS和GP的结合,揭示了菠菜植物高度的遗传基础,并评估了不同预测模型在这一性状上的应用潜力。这些结果不仅为菠菜的遗传改良提供了新的视角,也为其他作物的基因组选择研究提供了参考。未来的研究可以进一步探索这些SNP和候选基因的功能,以及它们在不同环境条件下的表现,从而为开发高产、抗倒伏的菠菜品种提供更全面的遗传信息支持。同时,随着基因组学技术的不断进步,结合高通量测序和先进的预测模型,有望在菠菜育种中实现更高效的性状改良和品种创新。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号