基于盲解混和端元引导自动编码器模型解析浮游植物色素吸光光谱的研究

【字体: 时间:2025年04月17日 来源:Scientific Reports 3.8

编辑推荐:

  为解决从高光谱数据中解混浮游植物固有光学属性的复杂难题,研究人员开展基于盲解混(BAE)和端元引导自动编码器(EGAE)对浓缩水样高光谱吸光数据非线性解混的研究。结果显示 EGAE 表现更优,该研究有助于精准解混高光谱数据,推动相关领域发展。

  在广袤的水体世界里,浮游植物虽微小却意义重大。它们作为全球碳循环的基础,对环境变化反应迅速,其色素组成和浓度影响着水体的光学特性。高光谱技术就像一双 “透视眼”,能从不同尺度对水体进行监测,为研究浮游植物提供了有力工具。然而,从高光谱数据中准确解混浮游植物的内在光学属性,却如同在错综复杂的迷宫中找出口,困难重重。
水体是一个复杂的 “大杂烩”,除了浮游植物,还有各种溶解和悬浮物质,它们相互作用,使得高光谱监测中的信号解混变得异常棘手。传统的线性解混模型过于简单,无法应对复杂的物理相互作用,而深度学习技术的兴起,为解决这一难题带来了新的希望。在此背景下,芬兰于韦斯屈莱大学(University of Jyv?skyl?)的研究人员 Pritish Naik、Ilkka P?l?nen 和 Pauliina Salmi 开展了深入研究,相关成果发表在《Scientific Reports》上。

研究人员主要运用了以下关键技术方法:首先,采集了 2022 年 5 - 6 月来自苏格兰 20 个湖泊的水样,通过离心浓缩后用光谱成像仪记录光谱,利用 HPLC 测定叶绿素和类胡萝卜素,用分光光度计分析藻蓝蛋白浓度。接着,将数据分为训练集和测试集,采用数据增强和归一化处理数据。然后,构建 BAE 和 EGAE 模型,利用 Hyperband 方法优化超参数,使用不同损失函数评估模型性能,通过皮尔逊相关系数和变异系数衡量模型的解混性能和稳定性。

研究结果如下:

  1. 选定 BAE 和 EGAE 的解混性能:端元和丰度估计:BAE 模型提取的端元与参考光谱不完全匹配,如 chl-a 和 fx 参考光谱与同一端元估计匹配,未完全解混;pc 虽与参考峰有一定匹配但含其他成分。不过,其丰度估计与真实浓度在训练和测试集上对 chl-a、fx 和 pc 都有正相关()。EGAE 模型因固定了色素端元,无需光谱匹配。对比发现,BAE 模型对 chl-a 的相关性与 EGAE 相近,但对 fx 在训练和测试集上表现较差,且无法解混 pc;而 EGAE 成功解混 pc,且与真实浓度相关性强,在色素识别方面表现更优。
  2. 不同损失函数下 10 个最佳 BAE 和 EGAE 模型的解混性能:以 MSE 为损失函数时,10 个最佳 BAE 模型只能成功解混三种色素中的两种,无法同时解混全部三种色素,尤其是对 pc 的解混效果不理想。EGAE 则能有效解混三种色素端元,以 MSE 为损失函数时,在 10 个最佳模型中有 7 个成功提取了全部三种端元,解混结果更稳定。在训练集和测试集中,不同损失函数下 EGAE 在提取端元和关联实际色素浓度与估计丰度方面都优于 BAE。
  3. 不同网络配置和损失函数下 10 个最佳 BAE 和 EGAE 模型的稳定性分析:BAE 模型在不同配置和相同拓扑结构的不同执行中,丰度估计存在显著差异,稳定性较差,变异系数较高。EGAE 模型则显著提高了稳定性,尤其是以 MSE 和加权 MSE - SAD 为损失函数时。例如,在测试集上,EGAE - MSE 模型对 chl-a、fx 和 pc 的变异系数分别为 6.35%、7.54% 和 24.65%,远低于 BAE - MSE 模型。

研究结论和讨论部分表明,在水生环境高光谱解混中,EGAE 展现出卓越的性能。它能有效解混浮游植物色素光谱,将浮游植物群落组成映射到低维潜在空间,助力研究关键特征和功能。与 BAE 相比,EGAE 对神经网络架构和端元数量的敏感性更低,在复杂光谱解混场景中更具稳健性和适应性。该研究为利用 EGAE 进行特定光合色素的靶向解混奠定了基础,有望推动浮游植物监测和水生生态系统研究的发展,帮助人们更好地了解水体环境变化,为保护和管理水生生态系统提供科学依据。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号