基于高光谱技术的桃子内部品质指标评估及定量迁移学习模型分析

《Powder Technology》:Hyperspectral-based assessment of internal quality indicators of peach and quantitative transfer learning model analysis

【字体: 时间:2025年08月06日 来源:Powder Technology 4.6

编辑推荐:

  迁移学习在光谱成像预测 peach 多质量指标中的应用研究。提出 PCA-ELM-TrAdaBoost 模型,整合主成分分析、加权极端学习机和 TrAdaBoost 算法,优化光谱数据特征提取与信息表示能力,实现跨质量指标的知识迁移。实验表明该模型在小样本条件下(100 个样本)对 SSC、FF、MC 的 RPD 值分别达到 2.4、1.6、2.5,整体预测精度较传统单指标模型提升显著,验证了跨指标迁移学习的有效性和模型泛化能力。

  本研究聚焦于利用高光谱成像技术进行桃子内部质量指标的预测,提出了一种基于迁移学习的PCA-ELM-TrAdaBoost模型。该模型整合了主成分分析(PCA)、加权极限学习机(ELM)和TrAdaBoost算法,旨在优化光谱数据的特征提取与信息表示能力,从而实现不同质量指标间的有效知识迁移。高光谱成像技术结合了传统成像与光谱分析,能够同时获取物体的光谱和空间信息,为水果质量评估提供了强大的工具。然而,现有的研究大多集中在相同品种或不同品种之间相同质量指标的迁移,而对不同质量指标间的迁移探索相对不足。

'Yangshan'桃子作为中国四大名桃之一,具有悠久的种植历史和丰富的文化背景,是地方特色农产品,其市场价值较高,对当地农民的收入有重要影响。传统上,'Yangshan'桃子的分级主要依赖于经验丰富的种植者,通过评估桃子的外部质量指标,如大小和重量来判断其品质。然而,这种方法不仅效率低下,还无法满足消费者对高品质水果日益增长的需求。此外,传统的内部质量指标检测方法,如可溶性固形物含量(SSC)、果肉硬度(FF)和水分含量(MC)的测定,往往需要破坏性采样,过程繁琐且耗时,难以应用于大规模或实时检测。

为了克服上述局限,近年来,研究人员开始关注非破坏性检测方法,特别是高光谱成像技术的应用。高光谱成像技术能够通过捕捉物体在可见光和近红外波段的光谱信息,实现对水果内部质量指标的无损评估。已有研究表明,该技术在苹果、梨、蓝莓和猕猴桃等水果的质量评估中取得了良好效果。例如,Jang等人(2022)利用400–1000?nm波段的高光谱系统收集了' Madoka'桃子的光谱数据,并通过多种数据预处理方法,实现了对SSC的预测,取得了R2值为0.87的优异结果。Xuan等人(2022)则通过高光谱成像数据构建了非破坏性回归模型,用于预测桃子的FF,其验证集的R2值达到0.826,RPD值为2.401。尽管关于桃子MC的预测研究较少,但在其他水果中,如香蕉和芒果,已有较为成熟的研究成果。例如,Rajkumar等人(2012)利用高光谱成像结合偏最小二乘法(PLS)对香蕉的MC进行了建模,分别获得了校准集和验证集的R2值为0.81和0.9。Pu和Sun(2016)则通过近红外高光谱成像与多元分析相结合,对四种不同形状的芒果切片的MC进行了预测,取得了R2值为0.993和RMSEP值为1.282的优异结果。

在高光谱成像技术的应用中,迁移学习作为一种重要的策略,被广泛用于解决因生物差异和仪器差异导致的模型适应性问题。迁移学习的核心在于将一个源域中的知识迁移到目标域,以提升模型在目标域上的预测性能。例如,Liu等人(2022)提出了一种基于偏最小二乘回归(PLSR)的增强建模方法,该方法结合了卷积自编码器和异构迁移学习,用于苹果的SSC预测,并在小样本情况下取得了较好的效果。Yang等人(2022)则提出了一种基于有限样本的模型微调方法,用于在季节变化条件下对水果进行检测,这种方法在Tsui Kwan梨、Rocha梨和芒果数据集上分别实现了SSC的RMSE值为0.407、1.035和0.642。Li等人(2025)则开发了单任务和多任务卷积神经网络模型,用于柑橘质量评估,并探讨了这些模型在高光谱成像与近红外光谱数据之间的迁移可行性。他们的研究表明,对于两种柑橘品种,模型在SSC和pH的预测上均表现出较强的性能,最佳相关系数分别超过了0.8和0.9。Tan等人(2023)提出了一种基于改进的一维Inception-ResNet网络的深度迁移学习方法,用于建立甘蔗中两种化学成分的定量模型,并验证了其在不同光谱仪之间的迁移能力。通过使用来自三种不同仪器的近红外光谱数据,该模型在预测精度上优于传统的PLSR方法,并在新光谱仪上实现了稳定和准确的性能。Wang等人(2024)则选取了' Huayou'和' Xuxiang'两种猕猴桃品种,利用两阶段TrAdaBoost.R2方法系统地研究了模型在不同品种间的迁移能力,结果表明,经过迁移的模型在预测另一种品种的SSC时达到了较高的精度,有效缓解了品种间样本异质性带来的影响,验证了该方法的可行性与优越性。

尽管上述研究在高光谱成像与迁移学习的结合上取得了显著进展,但仍有不足之处。目前的研究主要集中在相同成分在不同品种间的迁移,或者相同品种中相同成分的迁移,而对于同一品种中不同成分之间的迁移研究较少。此外,迁移学习模型的泛化能力仍有待提升,特别是在小样本目标域的情况下。因此,本研究旨在填补这一空白,通过构建基于PCA-ELM-TrAdaBoost的迁移学习模型,探索不同质量指标之间的迁移效果,并评估该模型在小样本目标域中的表现。具体目标包括:(1)分析桃子不同质量指标之间的相关性;(2)构建基于高光谱数据的桃子不同质量指标间的迁移学习模型;(3)评估迁移学习模型在小样本目标域中的迁移性能。

在样本准备阶段,本研究选取了来自中国江苏省无锡市商业果园的'Yangshan'桃子,所有样本均为' Bai Feng'品种,代表了该地区传统的'Yangshan'桃子。共选取了150个无损伤、无病害、无缺陷的桃子样本,并将其运输至实验室。在实验过程中,每颗桃子均被用干净的毛巾轻轻擦拭,以去除表面杂质。随后,利用高光谱成像设备对桃子的光谱数据进行了采集。为了提高数据质量,对采集到的光谱数据进行了SG平滑处理,以去除噪声。然而,在预处理后的光谱数据中,仍发现两端存在显著的噪声,因此选择400–1000?nm波段进行进一步分析。经过预处理后的光谱数据被用于后续的特征提取与建模工作。

在光谱特征分析阶段,研究重点在于不同质量指标(SSC、FF和MC)之间的相关性。通过分析预处理后的光谱数据,可以观察到在可见光波段,桃子的光谱存在一个显著的吸收峰,位于675?nm处,该吸收峰主要与叶绿素有关。此外,在470–500?nm波段附近也存在一个吸收峰,这可能与桃子中的其他化学成分有关。通过对这些光谱特征的深入研究,可以更好地理解不同质量指标在光谱上的表现,并为后续的特征提取和模型构建提供依据。

本研究提出的PCA-ELM-TrAdaBoost模型,通过整合主成分分析(PCA)、加权极限学习机(ELM)和TrAdaBoost算法,实现了对不同质量指标间知识迁移的优化。PCA用于提取光谱数据中的主要特征,减少数据维度,同时保留关键信息。ELM作为一种快速且高效的神经网络算法,能够有效地处理高光谱数据,并通过加权方式提升模型的适应性。TrAdaBoost算法则用于在不同质量指标之间进行迁移学习,通过迭代优化,提升模型在目标域上的预测性能。实验结果表明,该模型在小样本目标域中表现良好,SSC、FF和MC的RPD值分别超过了2.4、1.6和2.5。尽管在FF的预测性能上相对较弱,但整体模型在小样本条件下仍表现出较高的稳定性和迁移能力。

在讨论部分,本研究对比了其他迁移学习研究的成果,指出虽然已有研究在特定水果的质量指标预测上取得了较好的效果,但对不同质量指标之间的迁移研究仍较为有限。例如,Abasi等人(2019)的研究将玉米的蛋白质含量作为目标域,利用水分、脂肪和淀粉作为源域进行迁移学习建模,虽然取得了较好的预测效果,但其模型仅限于单一成分的迁移。Yu等人(2021)则以饼干的脂肪含量作为目标域,通过迁移水分、蔗糖和面粉的特征进行建模,虽然在某些方面取得了良好效果,但其研究并未涉及不同质量指标之间的迁移。这些研究虽然在特定任务上取得了进展,但在多指标迁移和模型泛化能力方面仍有待深入探讨。

本研究提出的PCA-ELM-TrAdaBoost模型,通过融合多源信息和迁移学习策略,实现了对不同质量指标间的有效迁移。该模型在预测桃子内部质量指标方面表现出色,特别是在小样本条件下,其稳定性和迁移能力得到了验证。通过优化特征提取和信息表示,该模型不仅提升了预测性能,还为其他水果的多指标迁移学习提供了新的思路和方法。未来的研究可以进一步探索该模型在其他水果中的应用,以及如何通过改进特征提取和迁移策略,提升模型的泛化能力和适应性。此外,还可以结合更多的数据预处理方法和模型优化技术,以提高预测精度和鲁棒性。

本研究的结论表明,通过构建基于迁移学习的PCA-ELM-TrAdaBoost模型,可以有效实现桃子不同质量指标间的知识迁移,从而提升预测性能。实验结果验证了该模型在小样本目标域中的有效性,其在SSC、FF和MC的预测中均表现出较高的准确性和稳定性。这一成果不仅为桃子质量评估提供了新的方法,也为其他水果的多指标迁移学习研究奠定了基础。未来的工作可以进一步优化模型结构,提升其在不同水果和不同质量指标间的迁移能力,以满足实际应用中对高效、准确和鲁棒性的需求。

在作者声明部分,研究团队确认该论文为原创,未在其他期刊上发表,并且目前没有被其他期刊考虑发表。所有作者均对论文内容进行了审阅,并同意其发表。此外,作者声明他们没有已知的财务利益或个人关系可能影响本研究的客观性。在致谢部分,研究团队感谢了国家自然科学基金、中国博士后科学基金和中央高校基本科研业务费的支持,这些资金为本研究的顺利进行提供了重要保障。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号