
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:后基因组时代全基因组关联研究在下一代作物育种中的应用
【字体: 大 中 小 】 时间:2025年08月31日 来源:Plant Breeding 1.8
编辑推荐:
这篇综述系统阐述了后基因组时代全基因组关联研究(GWAS)在作物育种中的关键作用,重点探讨了连锁不平衡(LD)原理、群体结构校正模型(如MLM、FarmCPU)、多亲本群体设计(MAGIC/NAM)等核心技术,并创新性提出极端表型GWAS(XPGWAS)策略,为高精度标记开发提供了方法论指导。
后基因组时代的作物育种革命
ABSTRACT
在基因组学辅助育种时代,GWAS通过检测标记与目标性状的连锁不平衡(LD),已成为替代传统QTL作图的主流技术。其优势在于能捕获历史重组事件,利用自然群体或育种材料即可实现高分辨率定位,同时规避了QTL验证的繁琐流程。
1 Introduction
植物育种的核心在于聚合优良性状,而标记辅助选择(MAS)需先明确数量性状位点(QTL)的位置和效应。传统连锁作图仅能检测10-20cM范围的QTL,而关联作图(AM)通过LD原理整合了突变、遗传漂变等多重进化动力形成的非随机关联。GWAS分为全基因组扫描(GWAS)和候选基因关联分析(CGAM),前者适用于未知基因定位,后者针对特定基因组区域。
2 LD
LD量化了位点间等位基因的非随机共分离,常用D'和r2指标衡量。以水稻为例,自交作物LD衰减距离可达数百kb,而异交作物如玉米仅约2kb。通过公式M=G/(2r)2(G为基因组大小,r为重组率)可计算最低标记数,但实际研究中标记密度常超理论值10倍以上。LD分析软件如Haploview、TASSEL可高效处理海量SNP数据。
3 群体设计策略
非结构化群体(种质资源、地方品种)能捕获广泛等位变异,但需校正群体分层(Q矩阵)和亲缘关系(K矩阵)。结构化群体中,多亲本高级互交系(MAGIC)通过"漏斗式"杂交设计实现基因组精细重组,而巢式关联群体(NAM)以单一轮回亲本整合多供体等位基因,如玉米B73-NAM群体已定位到控制穗行数的145个SNP。
4 统计模型演进
广义线性模型(GLM)因忽略亲缘关系易产生假阳性,混合线性模型(MLM)通过引入K矩阵提升准确性。新兴的多基因背景控制模型如FarmCPU采用固定-随机效应循环检验,BLINK则基于贝叶斯信息准则优化LD区块筛选。机器学习方法如支持向量回归(SVR)可捕捉非线性互作,LASSO回归能筛选关键SNP组合。
5 技术挑战突破
群体结构可通过STRUCTURE软件估算亚群比例(ΔK法),罕见等位基因(MAF<5%)需扩大群体规模或采用选择性基因分型。错误发现率(FDR)控制中,Benjamini-Hochberg校正比Bonferroni法更具统计效能。极端表型GWAS(XPGWAS)对5%极端个体进行混池测序,在木豆抗虫性研究中成功定位16,489个非同义SNP。
6 应用前景
GWAS已在水稻(3K基因组计划)、小麦(35K SNP芯片)等主粮作物中规模化应用。结合基因组选择(GS)和基因编辑技术,未来将实现从标记开发到品种设计的全链条优化。不过,多环境表型精准鉴定仍是限制GWAS效力的关键瓶颈。
7 机器学习赋能
深度学习模型可解析高阶SNP互作,如卷积神经网络(CNN)识别棉花纤维强度相关基因组热点。基于特征选择的随机森林算法能降低维度灾难,在预测大豆盐胁迫响应基因GmCHX1时准确率达89%。
8 未来方向
整合多组学数据的eGWAS(表观基因组)和pGWAS(蛋白质组)将成为新趋势。作物泛基因组计划的推进,将进一步提升GWAS在野生资源优异等位基因挖掘中的分辨率。
生物通微信公众号
知名企业招聘