利用航空表型分析技术评估大豆的关键形态生理特征及产量
《Smart Energy》:Aerial Phenotyping to assess key morphophysiological traits and yield in soybean
【字体:
大
中
小
】
时间:2025年08月07日
来源:Smart Energy 5
编辑推荐:
植物高度、叶面积指数、气孔导度和叶绿素含量等形态生理参数是预测大豆产量的关键指标。传统现场测量方法效率低且难以规模化,而多光谱无人机遥感结合LASSO回归可高效预测这些参数及产量。研究表明,红边与近红外相关的植被指数(如REdgeCl2、CIRE)对株高、气孔导度和产量的预测效果最佳,而叶绿素相关指数(如CIG、PSRI)对叶面积指数和叶绿素含量的预测更优。最佳采样时期为开花至完全结籽阶段(R2-R6),此时植被结构最稳定,指数间相关性最强。LASSO模型通过特征选择有效整合多源数据,显著优于传统线性回归。该技术为大规模精准农业中的大豆监测与产量预估提供了新方法。
这项研究探讨了利用无人机(UAV)搭载的多光谱(MS)传感器和LASSO回归模型,对大豆(Glycine max)关键形态生理参数及产量进行高通量(HTAP)表型分析的可能性。大豆作为全球第四大种植作物,其产量占全球农业贸易的约9%,在美国则位居第二,占据约31.2%的种植面积,并带来每公顷约544.89美元的净收益。由于其高蛋白和高油含量,大豆被广泛用于人类和动物的营养供给。随着全球人口的持续增长,提高作物产量以确保粮食安全成为迫切需求。预计到2025年,农业作物产量需翻倍,因此提升大豆产量尤为重要。
大豆产量受到多种形态生理参数的影响,包括株高(PH)、叶面积指数(LAI)、气孔导度(g_s)以及叶绿素含量等。在不同大豆品种和生长阶段测量这些参数,有助于优化大豆生产。然而,传统的现场测量方法虽然在小范围具有较高的准确性,但在大规模监测中存在效率低、人力密集和难以实施的问题。此外,通过手动统计植株数、豆荚数和每豆荚的种子数来估算产量的方法,其结果往往不可靠。因此,开发高效的传感器技术成为提升农业产量监测的关键。
多光谱传感器通过红光、绿光、红边和近红外波段,能够提供关于植物生长和植被健康的重要信息。这些波段的组合可以有效研究植物的形态和生理状态。尽管已有许多研究利用植被指数(VIs)来估计单个参数,但较少有研究能够同时预测多个形态生理参数和产量。因此,本研究采用多光谱数据和LASSO回归方法,旨在识别最有效的植被指数,并确定最佳的空中表型采集时间。
研究结果表明,红边和近红外(NIR)相关的植被指数在预测株高、气孔导度和产量方面表现最佳,而与叶绿素相关的植被指数则在预测叶面积指数和叶绿素含量方面更有效。豆荚发育到种子成熟阶段是进行空中表型的最佳时机。总体而言,结合UAV多光谱图像和LASSO回归模型的方法,为大规模的大豆表型分析和产量监测提供了一种实用且高效的方式。该研究支持精准农业,为作物状态的评估提供了一种基于遥感、快速且非破坏性的方法。
本研究在肯塔基州州立大学的Harold R. Benson研究和示范农场进行,覆盖面积为75米长和30米宽。实验分为两个年度(2023和2024),并采用Split-Split-Plot随机完全区组设计,包括生物炭施用、大豆品种和晚期氮肥施用三个主要处理因素。生物炭施用分为无和12吨/公顷两种情况,大豆品种包括两个商业品种和两个先进的非结瘤大豆品系。晚期氮肥施用则在R5阶段分三次施用,分别在R5、R5后一周和R5后两周。实验共建立80个地块,每个地块长7.32米,宽1.83米,地块之间有0.9米的通道。整个实验在非灌溉条件下进行,种植时间分别为2023年5月15日和2024年5月21日,收获时间在每年9月下旬。
数据采集过程中,使用了DJI Mavic 3M无人机,其配备RGB和多光谱传感器。该无人机在不同生长阶段飞行,图像采集时间为上午10点至下午2点,以确保在晴朗天气下进行。2023年飞行高度为150英尺,2024年为100英尺,保持85%的侧重叠率和恒定的飞行速度,以确保图像覆盖的均匀性。为确保地理定位的准确性,实验区域的四个角落设置了地面控制点(GCPs),这些控制点由黑色和白色油漆标记的木质箱构成,并通过Trimble R12 GNSS接收器记录其地理坐标。无人机在多个时间点进行飞行,以捕捉不同生长阶段的关键信息,具体飞行日期和目的详见表2。
在图像处理阶段,使用Pix4D Field软件对UAV图像进行正射校正和正射拼接,生成拼接图像。然后,将这些图像与GCPs对齐,以确保空间精度。生成的正射拼接图像和植被指数(VI)地图被导出为TIFF格式,用于ArcGIS Pro中的进一步分析。在ArcGIS Pro中创建了7.315*1.83米的网格,从VI地图中提取反射率值,以代表每个地块的区域。通过“区统计表”工具,计算了每个地块内VI的均值、标准差、最小值和最大值。这些地块级的测量数据被系统记录在Excel表格中,以便后续分析。
在统计和建模分析中,首先使用简单线性回归分析不同成熟组(MGs)和时间设置下VI与植物参数之间的关系。随后,通过t检验和皮尔逊相关系数(r)验证这些相关性的统计显著性。选择出具有统计显著性的VI后,进一步评估其与不同表型特征的关系强度。计算的指标包括R2、RMSE和MAPE,以进一步评估所选VI的性能,并估算各种关键表型特征和产量组件。简单线性模型不仅提供了每种VI对植物参数的预测能力,还帮助确定不同生长阶段下哪种VI最能预测植物参数,从而提供关于关键表型特征的重要信息。
为了捕捉多变量关系并选择关键预测因子,研究采用了LASSO回归模型,该模型在R中使用glmnet包进行。在处理包含大量特征的数据库时,计算时间较长且准确性可能降低,因此确定最优变量数量对于机器学习模型至关重要。在建立表型模型时,需要提前选择相关特征。LASSO回归通过L1惩罚(即对系数的绝对值求和)来缩小某些系数至零,从而简化预测模型并提高可解释性。LASSO交叉验证(LASSOCV)模型通过调整超参数alpha来开发最优模型。在R中使用glmnet包时,预测变量首先被自动标准化(中心化和缩放),然后进行正则化。最优正则化参数λ_min(最小均方误差)通过10折交叉验证确定,以最小化各折叠中的均方误差(MSE)。
研究采用了k折交叉验证方法,利用R Studio中的caret包进行模型评估。数据被随机分为10个相等的折叠,其中9个用于训练模型,1个用于验证,这是表型研究中的标准做法。未对基因型进行明确分层,因为数据集已包含基因型的平衡表示,研究目标是评估整体预测性能。为了评估模型性能,选择了R2、RMSE和MAPE作为指标。这些指标的计算公式如表3所示。
在结果分析中,2023年和2024年的实地测量数据表明,植物参数如株高、叶绿素含量、叶面积指数和气孔导度在生长过程中表现出显著的时空变化。例如,株高在生长初期迅速增长,并在豆荚发育(R3)和种子填充(R5)阶段达到高峰。叶绿素含量的测量值在不同日期表现出不同的变化趋势,而气孔导度则在不同生长阶段存在显著差异。叶面积指数的变化则反映出植被冠层的动态发展。这些变化可能是由于环境条件、基因型差异和测量变化等因素引起的。
在2023年,大多数UAV衍生的植被指数与株高和叶面积指数呈显著正相关。PSRI指数在株高和气孔导度的预测中表现出最强的相关性(r=0.44和r=0.43),而MCARI指数在叶面积指数的预测中表现出最高相关性(r=0.59)。2024年,植被指数与植物参数之间的关系更加紧密,这表明随着生长阶段的推进,某些指数的预测能力增强。REdgeCl2指数在株高(r=0.74)和SPAD叶绿素含量(r=0.58)的预测中表现最佳,而MCARI和LCI指数在气孔导度(r=0.22)和叶面积指数(r=0.80)的预测中也显示出较强的相关性。LAI在所有植物参数中表现最好,与株高(r=0.53)和SPAD叶绿素含量(r=0.54)均呈显著正相关。
在不同成熟组(MGs)中,植被指数的预测能力表现出差异。2023年,MG2的株高和SPAD值预测能力较低,而MG4表现出更强的相关性。2024年,MG4的株高预测能力提高,而MG2的叶面积指数预测能力更佳。这些结果表明,不同基因型对植被指数的响应存在差异,强调了在精准农业中进行基因型特异性校准的重要性。尽管本研究开发了一个通用的预测模型,适用于不同基因型,但未来的研究可以通过探索基因型依赖的光谱-表型关系来提高预测精度。
在2023年,大多数植被指数在7月中旬至8月中旬对株高的预测表现良好,R2值在0.4到0.56之间波动。这表明,在生长中期,利用植被指数预测株高具有较高的准确性。然而,在8月中旬,株高预测的准确性有所下降,这与植物进入完全豆荚填充和生理成熟阶段有关。2024年的研究结果表明,4月和5月是预测株高的最佳时间,这与豆荚发育到种子填充阶段的光谱特征有关。LASSO模型的预测结果进一步验证了这些时间点的有效性,表明在完全种子填充阶段(R6)进行空中表型采集可以更准确地预测株高。
在叶绿素含量的预测中,2023年1月的数据显示,大多数植被指数与SPAD值之间存在显著正相关,但R2值范围较窄(0.01到0.26)。这表明,单个植被指数可能不足以准确预测叶绿素含量。2024年的研究结果显示,生理成熟阶段是预测叶绿素含量的最佳时间,随后是完全种子阶段。这些结果与之前的类似研究一致,表明在R2、R4和R6阶段,结合植被指数和机器学习模型可以更准确地预测叶绿素含量。
在气孔导度的预测中,研究发现,大多数植被指数在不同生长阶段表现出弱相关性,但在某些情况下,如R6阶段,预测能力有所提高。LASSO回归模型的应用显著提升了气孔导度的预测准确性,表明多个因素共同作用于气孔导度的估算。例如,结合高光谱数据、叶片温度和冠层高度可以进一步提高气孔导度的预测能力。
在产量预测方面,2023年的研究结果显示,植被指数与产量之间的相关性较弱,R2值范围为0到0.13。然而,2024年的研究中,产量预测能力显著提高,R3阶段被识别为最佳预测时间。LASSO模型在确定产量预测时间时,推荐R5阶段。这些结果与现有研究一致,表明在豆荚发育到种子填充阶段,植被指数与产量之间存在高度正相关。因此,选择合适的生长阶段对于利用植被指数进行产量预测至关重要。
研究还分析了不同植被指数在预测植物参数和产量时的表现。REdgeCl2在预测株高、气孔导度和产量方面表现最佳,而CIG和CIRE在预测叶绿素含量方面更有效。此外,LAI的预测在某些阶段表现出更高的准确性,如MG2在2024年的研究中,其预测能力优于MG4。这些发现强调了不同基因型和生长阶段对植被指数预测能力的影响,进一步支持了在精准农业中进行基因型特异性校准的必要性。
LASSO回归模型在预测植物参数和产量方面表现出色,能够有效选择最优的植被指数和预测时间。模型的性能指标显示,LASSO在预测关键植物参数、产量及其预测时间方面均优于简单线性回归。LASSO模型通过处理多变量数据中的多重共线性问题,提高了预测的准确性。在某些情况下,如叶绿素含量的预测,LASSO模型表现出显著的提升,这表明结合多种预测因子可以增强模型的预测能力。
此外,研究还生成了不同植物参数和产量的空间分布图,以可视化模型的预测结果。这些空间分布图显示,预测值与实际测量值之间存在良好的一致性,表明UAV多光谱数据和LASSO回归模型在田间条件的映射中具有潜在应用价值。然而,研究也指出了某些局限性,例如未测量土壤湿度、植物水分状况和土壤温度,这限制了对干旱影响的定量分析。此外,尽管数据集中的基因型相对平衡,但随机分层可能无法完全解决基因型不平衡的问题。未来的研究可以考虑引入热成像和结构数据,以及更先进的土壤校正技术,以进一步提高多光谱图像在植物参数预测中的准确性。
总体而言,本研究证明了利用UAV多光谱图像和LASSO回归模型进行大豆高通量表型分析的有效性。在生长中期,特别是豆荚发育到种子填充阶段,植被指数与农业性状之间的相关性最高,为植物生长和发育研究提供了重要信息。然而,环境条件的变化需要被纳入考虑,以确保预测结果的可靠性。株高和叶面积指数与植被指数之间的强相关性表明,红边和近红外相关的植被指数在预测株高、气孔导度和产量方面具有最佳效果,而与叶绿素相关的植被指数在预测叶面积指数和叶绿素含量方面表现更优。这些发现为精准农业提供了新的工具和方法,能够快速、非破坏性地评估作物状态,提高产量预测的效率和准确性。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号