
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于深度学习和GBLUP-MGIDI联合分析的甜椒产量预测与优异基因型筛选
【字体: 大 中 小 】 时间:2025年04月28日 来源:Scientific Reports 3.8
编辑推荐:
为解决甜椒(Capsicum annuum L.)育种中产量预测复杂性和多性状协同选择难题,伊朗马拉盖大学和乌尔米大学团队通过卷积神经网络(CNN)建模结合基因组最佳线性无偏预测(GBLUP)和多性状基因型-理想型距离指数(MGIDI),成功筛选出兼具高产潜力(G12、G13)和综合优良性状(G11、G15)的基因型。研究通过CNN模型(R2=0.879)精准预测产量并识别关键性状果肉厚度(FT)和果宽(FW),同时利用65个ISSR标记解析加性遗传效应,为甜椒分子设计育种提供了高效策略。
甜椒育种的新智能路径:当深度学习遇见基因组预测
在追求农作物高产稳产的今天,甜椒(Capsicum annuum L.)作为全球重要的蔬菜和经济作物,其产量提升却面临多重挑战。传统育种依赖经验性选择,而产量作为典型的多基因性状,易受环境干扰且与众多形态特征存在复杂非线性关系。更棘手的是,育种者常需同时改良多个相互制约的性状——如果实大小与植株抗倒伏性往往呈负相关。如何精准预测产量、解析关键性状的遗传控制机制,并高效筛选综合性状优良的基因型,成为甜椒育种亟待突破的科学难题。
来自伊朗马拉盖大学和乌尔米大学的研究团队在《Scientific Reports》发表了一项创新研究,首次将深度学习中的卷积神经网络(CNN)与基因组预测技术(GBLUP)和多性状选择指数(MGIDI)相结合,构建了一套甜椒智能育种方法论。通过对29份伊朗本土甜椒种质进行系统分析,研究人员不仅实现了高达R2=0.879的产量预测精度,还筛选出兼具高产潜力和理想株型的核心亲本,为甜椒分子设计育种提供了可量化的决策工具。
关键技术方法
研究团队在乌尔米农业研究中心开展两季田间试验,采用随机区组设计评估29份种质的14个农艺性状。通过ISSR分子标记构建遗传相似性矩阵,运用CNN模型(含2个卷积层和3个全连接层)比较相关性分析(模型a)和逐步回归(模型b)的输入变量效果。采用GBLUP计算育种值(BV),结合MGIDI指数进行多性状综合评价,所有分析均在MATLAB R2021b和R语言中完成。
关键研究发现
1. 甜椒产量建模与关键性状识别
通过比较两种CNN模型发现,基于相关系数筛选的模型a(输入PH、FL、FT、FTL、FW、FFW)预测性能更优(测试集R2=0.879)。敏感性分析揭示果肉厚度(FT)和果宽(FW)是共同的关键预测因子,其重要性在逐步回归模型b中再次被验证。值得注意的是,10果实鲜重(FFW)在模型b中表现出决定性影响——移除该变量导致预测精度骤降至R2=0.023,暗示果实大小与产量的强关联性。
2. 基因组育种值解析
GBLUP分析显示,G25基因型在FT(1.372)、FW(4.633)等产量相关性状上具有显著加性效应(均为最高BV),而G12在单株产量(Y)上表现突出(BV=2.242)。有趣的是,部分基因型呈现性状间的遗传拮抗——如G14虽在FT(1.076)和FW(3.139)上表现优异,但其株高(PH)育种值低至-6.986,提示矮化株型可能与果实发育存在遗传连锁。
3. 多性状理想型筛选
MGIDI指数通过因子分析降维,将14个性状整合为5个主成分(累计解释83.1%变异)。FA1主导产量相关性状(FFW载荷0.92),FA4则调控株型特征(SL载荷0.87)。最终筛选的G11-G13、G15基因型在85%性状上实现理想选择差,其中G12和G13在FA1(产量潜力)和FA2(果实品质)上均接近理想值,而G15在FA4(株型结构)上表现最佳。
研究启示与展望
这项研究开创性地将深度学习与基因组选择技术应用于甜椒育种,其价值体现在三个维度:方法学上,证实CNN模型能有效捕捉产量与形态性状的非线性关系,相较传统线性回归(R2通常<0.6)具有显著优势;育种实践上,明确FT和FW可作为间接选择标记,且G12、G13等种质因其高育种值成为杂交亲本优选;理论层面上,揭示产量相关性状主要受加性基因控制,为后续QTL定位奠定基础。
研究仍存在可拓展空间:当前ISSR标记密度(65个位点)可能限制GBLUP精度,未来采用SNP芯片有望提升预测效果;环境互作未纳入模型,需多地点试验验证性状稳定性。该团队提出的"CNN-GBLUP-MGIDI"框架为其他作物复杂性状研究提供了普适性范式,其核心思路——即通过深度学习解析表型组、结合基因组预测实现智能育种——正引领作物遗传改良进入数字化新时代。
生物通微信公众号
知名企业招聘