基于低秩适应性和空间特征融合的番茄有机酸工业检测模型的构建

《Industrial Crops and Products》:Construction of an industrial detection model for tomato organic acids based on low-rank adaptation and spatial feature fusion

【字体: 时间:2025年10月02日 来源:Industrial Crops and Products 6.2

编辑推荐:

  番茄有机酸的非破坏性检测方法研究:结合LoRA与ASFFN的高光谱成像模型构建、特征优化及工业应用验证。

  番茄(Solanum lycopersicum L.)不仅是全球重要的食物来源,还被视为工业有价值的有机酸来源。有机酸如柠檬酸和苹果酸在生物基化学合成、发酵、可降解塑料和绿色溶剂等众多领域有广泛应用。本研究提出了一种新颖的非破坏性框架,结合低秩适应(LoRA)与自适应空间特征融合网络(ASFFN),以准确预测番茄中的有机酸含量。该模型通过先进的特征融合策略和强大的异常值检测,提升了在不同番茄品种间的泛化能力。对比实验表明,所提出的LoRA-ASFFN框架在传统卷积神经网络(CNN)和偏最小二乘回归(PLSR)基线模型上表现出更优的性能。该模型能够快速且精确地识别高有机酸浓度的番茄,为工业加工和提取提供了高效的路径。本研究通过数据驱动的精准筛选技术,推动了生物基化学供应链的发展,并提升了番茄作物的经济价值。

番茄作为生物基化学品的原料,因其富含有机酸而受到越来越多的关注。这些化合物在生物可降解聚合物、生物润滑剂、绿色溶剂以及微生物发酵中发挥着关键作用。然而,传统的有机酸定量方法,如色谱分离和体积滴定,存在破坏性采样、分析时间长和操作者依赖性强等局限,这使得它们在高通量表型分析或实时供应链监控中并不适用。为了解决这些问题,本研究利用了高光谱成像(HSI)技术,其独特的优势在于能够同时获取光谱和空间信息,广泛应用于农业领域的作物生长监测、病虫害识别和质量评估。HSI技术通过连续的高分辨率光谱数据采集,可以快速准确地确定农产品的内部成分和结构。然而,不同品种和栽培条件可能会影响样品的漫反射特性,导致数据计算复杂且模型泛化能力较弱。因此,为了实现HSI技术在番茄有机酸检测中的工业应用,开发一种能够适应多品种数据的模型至关重要。

在面对这一挑战时,深度学习技术展现出显著的优势,尤其是在大数据处理和特征学习方面。然而,由于全球数据来自不同品种,其特征分布差异较大,精确校准成为一项高度挑战性的任务。自适应空间特征融合(ASFF)是一种用于图像处理和计算机视觉任务的特征融合技术,旨在解决传统方法中特征不一致和模型泛化能力不足的问题。ASFF通过在特征融合过程中自适应调整不同尺度下的空间权重,充分利用模型中的多尺度信息,从而增强其对复杂任务的理解能力。在本研究中,为了处理不同品种番茄的高光谱数据,将ASFF结构与LoRA相结合,构建了一个新的神经网络LoRA-ASFFN。该模型旨在建立一个用于确定番茄有机酸含量的光谱校准模型。

为了进一步优化模型性能,本研究还对多种预处理方法进行了比较。其中包括移动平均、基线校正、中值滤波、高斯滤波、归一化和标准正态变量(SNV)转换等。这些方法分别用于消除光谱数据中的噪声、基线漂移和散射效应,从而提高模型的预测能力。通过分析不同预处理方法对光谱数据的影响,可以确定最适合番茄有机酸检测的策略。例如,归一化方法通过将光谱数据缩放到[0,1]范围,平衡不同波长下的权重,从而增强模型对有机酸特征的识别能力。而SNV方法通过中心化和标准化,消除了样本间的系统偏移和尺度变化,提高了光谱数据的可比性。

在模型建立过程中,还采用了多种特征波长选择方法,包括无信息变量消除(UVE)、竞争自适应重加权采样(CARS)、迭代保留信息变量(IRIV)、变量组合群体分析(VCPA)和区间变量迭代空间收缩方法(iVISSA)。这些方法基于相关性、冗余性和随机性等不同原则,旨在减少数据冗余,提高模型效率。通过比较这些方法在不同数据集上的表现,可以评估它们在减少维度和提高预测准确率之间的平衡。例如,CARS方法通过蒙特卡洛采样,选择与目标变量高度相关的波长,从而提高模型的预测能力。而iVISSA方法利用遗传算法优化特征子集,实现波长数量与预测性能之间的最佳平衡。

在模型评估方面,本研究比较了多种模型的性能,包括LoRA-ASFFN、PLSR和CNN。LoRA-ASFFN模型在全波段数据上表现优异,其校准集相关系数(Rc)达到0.8993,预测集相关系数(Rp)为0.8082,显示出在预测准确性和稳定性方面的显著提升。PLSR和CNN模型在特征波长选择后也表现出一定的优势,但它们在处理高维数据时的性能仍然受到一定限制。相比之下,LoRA-ASFFN通过低秩适应机制,显著降低了模型的复杂度,同时保持了较高的预测性能。这使得该模型在工业应用中具有更高的可行性,特别是在需要实时预测和高效推理的场景中。

此外,本研究还采用了异常值检测技术,如孤立森林(IF),以提高模型的鲁棒性。通过计算样本在决策树中的“隔离深度”,IF能够有效识别并排除异常值。异常值的排除使得训练数据更加具有代表性,为后续的特征提取和模型训练提供了可靠的数据基础。在实验中,44个样本被识别为异常值并被移除,进一步验证了IF方法在检测异常值方面的有效性。PCA投影图显示,正常样本和异常样本在数据空间中形成了明显的分离,表明异常值的排除有助于提高模型的预测性能。

本研究的成果表明,通过结合HSI技术与先进的深度学习架构,可以实现对番茄有机酸含量的高效、非破坏性检测。LoRA-ASFFN模型在多个方面表现出显著的优势,包括减少训练成本、提高推理速度和增强模型的泛化能力。此外,该模型在处理多品种数据时表现出较强的适应性,能够有效捕捉不同尺度下的特征信息,并通过自适应空间权重融合,提升预测准确性。未来的研究可以进一步扩展样本收集范围,涵盖不同气候条件和土壤类型下的番茄品种,以增强数据的代表性。同时,开发一种适用于现场应用的系统,结合便携式高光谱相机和嵌入式计算模块,将有助于在实际生产环境中验证和优化模型。此外,对单个有机酸如柠檬酸和苹果酸的定量标注,以及对模型输出层的优化,将有助于实现对多个成分的同时检测,从而推动该框架在工业规模应用中的落地。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号