编辑推荐:
来自相关研究团队开展 LIBS 和 NIRS 数据融合研究,提出 DBAM-CNN 模型,提升水泥成分定量分析精度。
水泥作为一种基础建筑材料,主要由 CaO、SiO
2、Al
2O
3和 Fe
2O
3等氧化物组成。这些成分的浓度对水泥的强度、耐腐蚀性、耐久性和凝结时间有着重要影响。因此,在水泥生产过程中实时监测氧化物含量,对于确保原材料的最佳配比,进而生产高性能水泥至关重要。近年来,光谱技术因其快速便捷的特性受到广泛关注,人们越来越倾向于利用这些方法快速评估水泥生产中的氧化物浓度,实现成分的实时监测。
如今,X 射线荧光光谱法(XRF)、瞬发伽马中子活化分析(PGNAA)和湿化学分析等多种方法常用于水泥分析。然而,XRF 需要大量的样品制备工作,对表面粗糙度敏感,成本高昂且存在辐射危害;PGNAA 受中子吸收、散射和伽马射线自吸收的影响,会降低测量稳定性,同样存在辐射风险;湿化学分析虽然准确,但由于样品制备和分析时间长,无法用于实时监测。
激光诱导击穿光谱(LIBS)被视为最具前景的技术之一,它具备多元素分析、实时监测和原位分析等独特能力。LIBS 是一种原子发射光谱技术,通过分析高能激光烧蚀样品表面产生的等离子体发射光谱,来确定样品的元素组成。由于水泥中的主要元素 Ca、Si、Al 和 Fe 在 LIBS 分析中易于电离,该技术作为水泥快速成分分析手段备受关注。不过,LIBS 的定量准确性受到信号不确定性和基体效应的限制。水泥样品复杂的基体特性进一步加剧了这一问题,即使样品元素含量相同,相同波长下的信号强度也可能存在差异,导致定量性能下降。此外,LIBS 无法直接测量分子信息,基于元素含量推断化合物浓度时,准确性存在潜在局限。因此,需要一种能够获取分子信息和基体特征的辅助技术,支持 LIBS 进行水泥定量分析。
近红外光谱(NIRS)是一种快速的分子光谱技术,通过光吸收后的分子振动泛音和组合带获取光谱信息。NIRS 因其速度快、成本低和原位分析能力,在水泥分析领域也受到关注。尽管在近红外范围内,水泥关键成分具有独特的光谱特征,但泛音导致的弱峰重叠会影响信号质量。而且,NIRS 易受样品基体变化的影响,仅依靠 NIRS 进行水泥分析,定量数据可能存在显著的非线性,影响模型的准确性和通用性。
单独使用 LIBS 或 NIRS 都无法满足精确的多组分水泥分析要求,但二者提供的互补信息为高精度测量提供了可能。LIBS 提供原子光谱,不仅能显示目标成分的元素组成,还能反映影响成分含量的元素特性;NIRS 提供分子光谱,可呈现元素形成的化合物信息,并反映样品的基体特征。在土壤、煤炭和农业等多个领域的研究表明,融合 LIBS 和 NIRS 数据能够显著提升模型的分析性能。
一般来说,现有的通过整合光谱数据提升模型性能的融合策略主要分为三类:数据集级(低级)融合、特征级(中级)融合和决策级(高级)融合。与单一测量技术的建模方法相比,融合模型整合的信息更全面,通常具有更高的准确性和稳定性。在数据集级融合方面,相关研究人员通过整合 LIBS 和 NIRS 数据集构建模型,结果显示该融合方式有效整合了原子和分子信息,分类准确率达到 100%。在特征级融合中,研究人员从 LIBS 和 NIRS 数据中提取并合并特征,定量模型结果表明,与单独使用 LIBS 数据相比,特征级融合显著提高了定量准确性。决策级融合方面,研究人员利用卷积神经网络(CNN)分别对 LIBS 和拉曼数据进行建模,然后在决策层实现数据融合,结果显示,与单一技术构建的模型相比,决策级融合显著提升了卷积神经网络在分类算法中的性能。此外,决策级融合方法还广泛应用于解决食品、合金和制药等领域中单一 LIBS 预测的局限性,提高了模型的准确性和稳定性。
尽管数据融合方法在解决单一 LIBS 技术局限性方面潜力巨大,但如何优化利用融合后的信息仍存在问题。数据集级融合保留了原始数据集的全部信息,但部分研究表明,该融合方式并不总是比单光谱分析效果更好,因为可能引入信息冗余,过多的无关信息(如噪声和冗余数据)会影响模型的预测能力。而且,缺乏适当的标准化处理可能导致不同数据集在维度或强度上存在差异,影响融合效果。特征级融合在合并前从 LIBS 和其他光谱数据集中提取相关特征,可避免上述问题,但现有研究指出,特征提取过程中缺乏全局视角,可能会丢失对预测任务有价值的光谱信息,导致某些情况下特征级融合的性能不如数据集级融合。决策级融合通过分别预测后整合结果,降低了信息冗余和特征丢失的风险,但它带来了决策层设计挑战,因为决策设计决定了不同技术在各种任务中的权重分配,不合理的权重分配可能导致结果不如其他融合方法或单一技术分析。总之,有必要进一步考虑不同融合方法在信息冗余、特征丢失和权重分配方面的不足,设计更合适的光谱信息互补融合方法。
在本研究中,研究人员提出了一种基于带有注意力模块的双分支卷积神经网络(DBAM-CNN)的新型光谱方法,用于整合 LIBS 和 NIRS 数据。该方法采用双分支结构分别输入 LIBS 和 NIRS 数据。首先,LIBS 和 NIRS 数据通过两个结构相似的 CNN 分支进行特征提取。随后,利用两个相同的空间注意力模块在空间域优化特征权重。接着,将两个分支的特征张量连接起来,通过通道注意力模块分配通道权重。最后,使用全连接层进行定量任务预测。在该方法中,预处理后的 NIRS 和 LIBS 数据被充分融入模型,确保了输入信息的完整性。此外,集成的神经网络结构使得在反向传播过程中,能够直接考虑两种输入对模型最终任务的影响,降低了重要特征丢失的风险。之后,两种输入数据通过两个不同的两层 CNN 进行深度特征提取,再进行合并,显著降低了信息冗余度。而且,注意力模块的引入有助于避免光谱融合过程中不同特征和光谱技术之间不合理的权重分配。该方法对水泥主要成分 CaO、SiO2、Al2O3和 Fe2O3进行了定量验证。结果表明,所提出的模型在准确性方面优于现有的数据集级、特征级和决策级融合模型,在大多数任务中稳定性也有所提升。此外,通过 SHapley Additive Explanations(SHAP)对 DBAM-CNN 的特征进行了阐释,结果表明该方法有效突出了 LIBS 和 NIRS 中有意义的特征,提高了定量分析结果。
样本
本研究选取了 48 种不同的国家标准水泥样品进行分析,其中包括 31 种不同的水泥标准样品、3 种水泥熟料标准样品和 14 种水泥原料标准样品。
模型优化
在模型训练阶段,本研究对所有神经网络结构设置了相同的参数。这些参数包括固定的全局种子(设为 2024)、使用 Adam 作为优化器,以及学习率调度器(初始学习率为 0.005,步长为 20,学习率衰减因子为 0.8)。此外,批量大小设为 16,训练 100 轮。在特征级融合中,采用主成分分析(PCA)提取特征。
结论
本研究开发了一种新型融合模型 DBAM-CNN,用于 LIBS 和 NIRS 数据的互补整合。通过采用带有注意力模块的双分支 CNN 架构,该模型有效地从两种光谱技术中提取并融合特征,聚焦于最相关的信息以实现准确预测。DBAM-CNN 成功克服了现有融合策略中的局限性,如信息冗余、特征丢失和不合理的决策。
作者贡献声明
陈炜张:撰写原始草案、方法学、调查、形式分析、数据整理。魏然宋:撰写 - 评审与编辑、调查。逸涵吕:调查。志坦刘:调查。兴龙高:调查。宗禹侯:撰写 - 评审与编辑。哲王:撰写 - 评审与编辑、监督、获取资金。
利益冲突声明
作者声明他们不存在已知的可能影响本文所报道工作的竞争性财务利益或个人关系。
致谢
作者感谢清华大学牵头的碳中和与能源系统转型(CNEST)计划,以及中国国家重点研发计划(编号:2023YFB4102900)的资金支持。