基于基因水平功能单倍型的GWAS揭示棉花驯化与改良的基因组学机制

【字体: 时间:2025年05月22日 来源:Nature Communications 14.7

编辑推荐:

  为解决传统全基因组关联分析(GWAS)在复杂基因组作物中基因定位效率低的问题,中国研究人员开发了基于基因水平功能单倍型(FH)的创新策略,通过对3,724份棉花种质资源的20个农艺性状分析,直接鉴定出532个具有育种潜力的数量性状基因(QTGs),并实验验证了关键基因GhFAH1在纤维品质改良中的作用,为植物功能基因高效挖掘提供了新范式。

  

棉花作为最重要的天然纤维来源,其驯化与改良历程长期受限于复杂基因组特性。传统GWAS在四倍体棉花中面临连锁不平衡(LD)干扰和基因定位模糊的困境,难以直接识别功能基因。尽管已有超过4,000个棉花基因组被测序,但如何从海量变异中精准挖掘决定农艺性状的因果基因仍是重大挑战。

为解决这一难题,浙江大学的研究团队创新性提出功能单倍型(FH)策略,将编码区非同义变异转化为基因水平的复合基因型标记。该研究整合了全球3,724份陆地棉种质资源(包括野生种、地方品种和现代栽培种),通过群体特异性基因型填补和质控,构建了包含1,368,685个FHs的全球最大棉花蛋白多样性数据库。研究成果发表于《Nature Communications》,为作物功能基因组研究提供了方法论突破。

关键技术包括:1) 基于深度≥10×的3,724份种质WGS数据,通过群体特异性填补获得23,057,253个高质量变异;2) 开发FH编码算法,将334,406个非同义变异转化为基因型组合;3) 采用混合线性模型(MLM)对245组表型数据进行FH-GWAS分析;4) 通过CRISPR-Cas9对候选基因GhFAH1进行功能验证。

结果部分
Mining of gene-level functional haplotype
通过Shannon均衡指数(EH)分析发现,现代栽培种基因多样性显著低于野生种,D11染色体受选择压力最强。57.54%的序列保守基因(SCGs)与细胞基本功能相关,而高多态性基因(HPGs)中37.31%与抗病性相关,93.53%呈现正选择(Ka/Ks>1)。

FH-based haplotype analysis reflects population structure
FH系统发育分析将种质分为6类,精准再现了从美洲野生种到中国主栽品种的育种轨迹。A06和A08染色体上的FH单倍型块(HBs)揭示了纤维品质与产量性状的遗传多效性,证实了20世纪美国品种对中国育种的基因渗透。

FH-based GWAS mapped QTGs associated with agronomic traits
相比传统SNP-GWAS发现的6,533个QTLs,FH-GWAS直接定位到5,022个QTG簇,其中35%与QTLs存在5Mb内共定位。A亚基因组富集了纤维品质、产量等性状QTGs,反映其更强的选择压力。效应分析发现19,228个FHs具有显著表型效应,7724个呈现多效性。

Validation of the effects of key QTGs
候选基因GhFAH1(编码阿魏酸-5-羟化酶)在20DPA纤维中特异性高表达,其FH-2/4型导致纤维长度(FL)和纺纱一致性指数(SCI)显著降低。CRISPR敲除实验证实该基因缺失可使纤维长度增加12.7%,为负向调控纤维发育的关键基因。

这项研究开创性地建立了基因水平FH分析框架,突破了多倍体作物复杂基因组对基因定位的限制。发现的532个高效应QTGs为分子设计育种提供了精准靶标,其中GhFAH1的验证证实了FH策略在功能基因挖掘中的高效性。研究不仅揭示了棉花驯化过程中亚基因组不对称选择的分子证据,更为重要作物复杂性状的遗传解析提供了普适性方法。通过量化现代品种中优良FHs的时序变化,发现2000年后中国育种更注重纤维品质改良,为未来"优质高产"协同改良提供了理论依据。该成果标志着作物遗传研究从"关联区间"向"功能基因"的范式转变,为育种5.0时代的基因组设计奠定了方法论基础。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号