编辑推荐:
在作物研究中,植物表型受多种因素影响,从遗传标记预测其动态颇具挑战。研究人员开展 “dynamicGP:结合基因组预测与动态模式分解预测植物性状动态” 的研究,发现该方法在预测多性状动态上优于传统方法,为作物育种精准预测提供新途径。
在植物的生长过程中,其表型就像一个神秘的宝藏箱,里面装满了各种有趣的 “宝贝”—— 性状。这些性状可不是简单的存在,它们受到遗传因素、环境条件以及两者之间复杂相互作用的影响,时刻都在发生变化。就好比不同品种的植物,在相同环境下生长,有的高大健壮,有的矮小瘦弱;而同一品种的植物,在不同环境中,叶子颜色、形状等也会有所差异。
长期以来,科学家们都渴望打开这个 “宝藏箱”,弄清楚植物表型的变化规律,从而更好地进行作物育种,提高农作物的产量和质量。传统的基因组预测(Genomic Prediction,GP)方法,就像是拿着一张静态地图去寻找动态变化的宝藏,只能在特定时间点对植物性状进行预测,无法捕捉植物整个生长周期中多个性状的动态变化。随着高通量表型分析(High - Throughput Phenotyping,HTP)技术的发展,大量植物表型数据不断涌现,但现有的预测方法却难以充分利用这些数据。例如,一些基于深度学习的方法虽然能预测图像时间序列,但无法直接结合遗传标记数据,限制了对未知基因型多性状动态的预测;而动态模式分解(Dynamic Mode Decomposition,DMD)方法虽在其他领域应用广泛,却尚未与遗传标记数据相结合应用于植物研究。
为了解开植物性状动态变化的谜题,来自德国马克斯?普朗克分子植物生理学研究所、波茨坦大学等多个研究机构的研究人员(David Hobby、Hao Tong 等人),踏上了一场充满挑战的科研之旅。他们开展了一项名为 “Predicting plant trait dynamics from genetic markers” 的研究,旨在利用遗传标记预测植物性状的动态变化。这项研究成果发表在《Nature Plants》上,为植物研究领域带来了新的曙光。
在研究过程中,研究人员主要运用了以下关键技术方法:
首先是高通量表型分析(HTP)技术,在德国莱布尼茨植物遗传学和作物植物研究所的自动化 HTP 设施中,对 347 个玉米重组自交系(RILs)和 9 个奠基系,以及 382 个拟南芥基因型进行多性状的时间序列测量,获取大量表型数据。
其次是动态模式分解(DMD),通过构建数学模型,确定一个时间不变的最佳拟合线性算子 A,以此来描述植物性状在不同时间点的变化关系,预测植物性状的动态变化。
最后是基因组预测(GP),利用单核苷酸多态性(SNP)数据计算遗传力,并通过岭回归最佳线性无偏预测(RR - BLUP)模型,从遗传标记预测 DMD 中相关矩阵的元素,进而预测未知基因型的植物性状。
下面来看看具体的研究结果:
- DMD 可预测玉米几何性状动态:研究人员将 DMD 应用于玉米多亲本高代杂交(MAGIC)群体的 347 个 RILs,对从多模态 HTP 成像测量的与生长相关的性状动态进行预测。通过网络聚类选取 50 个代表性性状,结果发现,经典 DMD 方法计算出的算子 A 在迭代使用时,能近乎完美地重现训练数据,但在递归场景下,由于误差传播,预测准确性会迅速下降。而基于 Schur 的 DMD 算法在递归场景下表现更稳健,具有良好的预测性能。
- dynamicGP 的构建模块具有遗传性:研究人员将基于 Schur 的 DMD 中的中间组件矩阵的每个元素视为单性状 GP 模型中的一个性状,利用玉米 MAGIC 群体的 70,846 个 SNP,分析这些矩阵元素的基于标记的遗传力。结果发现,动态 GP 的许多构建模块表现出中等至较高的遗传力,这表明它们可以从遗传标记中预测,进而用于预测算子Ar。
- 两种版本的 dynamicGP 在玉米中的性能存在差异:利用预测的矩阵Φ和R中的值,通过 5 折交叉验证重新创建预测的算子A,使用迭代和递归两种版本的 dynamicGP 对玉米的 50 个性状进行纵向预测。结果显示,迭代方法在不同时间点的预测准确性更一致,且性状遗传力随时间变化较小的,预测准确性更高。
- dynamicGP 在玉米中优于基线模型:将 dynamicGP 与基于 RR - BLUP 模型的 GP 基线方法进行比较,发现 dynamicGP 的迭代和递归版本在所有研究时间点上均优于基线模型,且在预测准确性和均方误差方面表现更优。此外,在预测未见基因型的未见时间点时,dynamicGP 同样表现出色。
- dynamicGP 可应用于拟南芥数据:研究人员对 382 个拟南芥基因型的 132 个性状的时间序列数据进行测试,经过聚类选取 45 个代表性性状。虽然拟南芥数据集中中间组件矩阵的元素遗传力比玉米数据集低,但 dynamicGP 在预测拟南芥性状时,仍在平均预测准确性、均方误差和高预测准确性性状数量等方面优于 RR - BLUP 基线模型。
综合上述研究结果,研究人员得出结论:dynamicGP 这种计算方法有效地解决了从遗传标记预测作物生长动态的问题,它通过将基因组预测应用于动态模式分解的构建模块,能够更好地预测未知基因型植物的多性状动态变化。这一成果在作物育种领域具有重要意义,它为研究基因型如何影响时间分辨表型,以及揭示构成表型的性状之间的时间依赖性提供了新的视角。未来,随着研究的进一步深入,dynamicGP 有望通过考虑环境因素的影响,进一步优化预测模型,为精准农业和培育适应特定地区的作物品种提供有力支持,推动农业领域的发展迈向新的台阶。