基于特征选择与 GABP 的葡萄叶绿素含量高光谱估算研究:精准农业的新突破

【字体: 时间:2025年03月08日 来源:Scientific Reports 3.8

编辑推荐:

  为解决葡萄叶叶绿素含量(LCC)定量预测难题,研究构建 SNV-RFE-GA-BP 框架, ,NRMSE =0.091,助力精准农业。

  在葡萄种植的世界里,叶片叶绿素含量(Leaf Chlorophyll Content,LCC)可是个 “关键角色”。它就像葡萄生长的 “健康指示灯”,直接反映着植株的生长状况,对葡萄的产量和品质有着至关重要的影响。要是 LCC 过低,葡萄叶片就会像缺乏活力的战士,提前衰老,不仅影响有机养分的合成,还可能导致葡萄出现着色不良、软果掉粒等问题,严重影响果实的品质。传统的 LCC 分析方法,就像繁琐的手工劳作,不仅操作复杂、耗时费力,还会对叶片造成损伤。而手持式叶绿素仪虽然能测定相对叶绿素含量,但对于追求精准的现代农业来说,它一次只能获取一个点的数据,无法实现对植物变量的实时监测。
随着科技的飞速发展,高光谱遥感技术逐渐崭露头角。它就像给研究者们提供了一双 “透视眼”,能快速、无损地收集数据,让人们得以深入了解作物的营养状况和生长态势。然而,在利用高光谱技术预测葡萄 LCC 的道路上,却布满了 “荆棘”。基线漂移、光谱峰重叠以及敏感光谱范围的不确定性,使得定量预测变得困难重重。

为了攻克这些难题,来自北京农业林业科学院信息技术研究中心、江苏大学农业工程学院、云南农业大学大数据学院等机构的研究人员携手展开了深入研究。他们的研究成果发表在《Scientific Reports》上,为葡萄种植的精准化管理带来了新的希望。

研究人员在这项研究中运用了多种关键技术方法。在数据采集阶段,他们精心挑选了位于北京房山区和云南元谋县的两个葡萄种植区域,分别种植着赤霞珠和阳光玫瑰葡萄。在不同的生长时期,采集了葡萄叶片的叶绿素含量数据(通过 SPAD-502plus 叶绿素含量仪测定)以及对应的高光谱数据(使用 ASD Filed Spec Pro 2500 背装式野外光谱仪)。在数据处理与模型构建阶段,采用了标准化变量(Standard Normal Variate,SNV)和多元散射校正(Multiplicative Scatter Correction,MSC)对原始光谱数据进行预处理;运用皮尔逊(Pearson)算法确定 LCC 的敏感光谱范围,再通过极端梯度提升(XGBoost)、递归特征消除(RFE)和主成分分析(Principal Components Analysis,PCA)进一步筛选敏感特征;最后基于遗传算法优化神经网络(Genetic Algorithm-Based Neural Network,GA-BP)、随机森林回归(Random Forest Regression,RFR)和支持向量机回归(Support Vector Machine Regression,SVR)构建回归模型进行 LCC 预测,并通过决定系数 、标准化均方根误差(Normalized Root Mean Square Error,NRMSE)来评估模型性能。

研究结果如下:

  • 高光谱数据预处理分析:不同品种葡萄叶片的反射光谱曲线趋势相似,但局部细节因生化成分差异而不同。光谱反射率在 527 - 602nm 的绿色和可见光区域有大峰值,551nm 处尤为显著;670nm 右侧是红色波段吸收谷,之后反射率急剧上升;762 - 1096nm 的近红外区域形成高反射平台。随着叶绿素含量变化,叶片光谱反射率在可见光和近红外波段有明显改变,550nm 和 750nm 附近变化最为突出。SNV 和 MSC 预处理有效消除了光谱差异,增强了光谱与数据的相关性。
  • 特征选择:利用 Pearson 算法确定了不同预处理下 LCC 的敏感波段。原始高光谱数据敏感波段集中在 550nm 和 770 - 1350nm;SNV 处理后,集中在 370nm、550nm、720nm 和 1270nm,720nm 处相关性显著增强;MSC 处理后,集中在 400nm、1950nm 和 2450nm,均与 LCC 呈正相关。进一步使用 XGBoost、RFE 和 PCA 提取敏感特征,发现不同预处理下筛选出的敏感波段各有特点,且 PCA 处理显示原始光谱存在大量冗余和误差。
  • GA-BP、RFR 和 SVR 模型分析:通过不同预处理和特征选择方法获取最优特征后,用 GA-BP、RFR 和 SVR 模型预测葡萄 LCC。结果显示,RFE 在不同预处理和模型中表现良好,而 XGBoost 表现较差。GA-BP 模型凭借遗传算法的全局搜索能力,在多数情况下优于其他模型。其中,SNV-RFE-GA-BP 框架表现最佳, ,NRMSE =0.091 。不同模型在 LCC 为 40 - 50 范围内预测效果较好,超出该范围时,经预处理的 GA-BP 模型效果有所提升。

研究结论与讨论部分指出,该研究基于高光谱技术测定葡萄 LCC,涵盖了不同时期的酿酒葡萄和鲜食葡萄,提高了模型的覆盖范围和通用性。研究表明,预处理能有效提升光谱与数据的相关性,不同特征筛选方法对模型精度影响较大。GA-BP 模型在拟合训练样本和测试叶绿素值时表现出良好的估计能力。不过,当 LCC 不在 40 - 50 范围内时,模型精度有待提高,后续研究可考虑剔除异常值或引入深度学习模型进一步挖掘数据特征。这项研究为构建葡萄关键生长指标的高光谱分析模型提供了新的理论框架,相关技术也有助于对葡萄或其他水果作物的生化指标进行快速监测,对推动精准农业发展具有重要意义。

娑撳娴囩€瑰宓庢导锔炬暩鐎涙劒鍔熼妴濠団偓姘崇箖缂佸棜鍎禒锝堥樋閹活厾銇氶弬鎵畱閼筋垳澧块棃鍓佸仯閵嗗甯扮槐銏狀洤娴f洟鈧俺绻冩禒锝堥樋閸掑棙鐎芥穱鍐箻閹劎娈戦懡顖滃⒖閸欐垹骞囬惍鏃傗敀

10x Genomics閺傛澘鎼isium HD 瀵偓閸氼垰宕熺紒鍡氬劒閸掑棜椴搁悳鍥╂畱閸忋劏娴嗚ぐ鏇犵矋缁屾椽妫块崚鍡樼€介敍锟�

濞嗐垼绻嬫稉瀣祰Twist閵嗗﹣绗夐弬顓炲綁閸栨牜娈慍RISPR缁涙盯鈧鐗哥仦鈧妴瀣暩鐎涙劒鍔�

閸楁洜绮忛懗鐐寸ゴ鎼村繐鍙嗛梻銊ャ亣鐠佹彃鐖� - 濞e崬鍙嗘禍鍡毿掓禒搴n儑娑撯偓娑擃亜宕熺紒鍡氬劒鐎圭偤鐛欑拋鎹愵吀閸掔増鏆熼幑顔垮窛閹貉傜瑢閸欘垵顫嬮崠鏍掗弸锟�

娑撳娴囬妴濠勭矎閼崇偛鍞撮摂瀣鐠愩劋绨版担婊冨瀻閺嬫劖鏌熷▔鏇犳暩鐎涙劒鍔熼妴锟�

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号