编辑推荐:
为解决食品安全风险预测的复杂性问题,研究人员开展基于上下文增强异构图神经网络(HGNN)的研究。通过实验发现该方法能有效识别风险,显著提高预测精度,为食品安全监管提供科学依据和技术支持。
在当今社会,食品安全问题如同高悬的达摩克利斯之剑,时刻威胁着人们的健康。随着生活水平的提高,人们对食品安全的关注度与日俱增。然而,食品安全数据具有高维度、多样性和非线性等特点,给风险预测带来了极大的挑战。传统的风险预测方法,如基于统计的方法和部分机器学习算法,在处理这些复杂数据时存在诸多不足,像依赖专家经验导致主观偏差、无法有效捕捉数据中的复杂关系以及计算成本高等问题。为了突破这些困境,来自浙江大学的研究人员开展了一项关于食品安全风险预测的研究。
研究人员提出了一种上下文增强的异构图神经网络(HGNN)框架,旨在实现对食品安全风险的精准预测。该研究成果发表在《Applied Food Research》上,为食品安全监管领域带来了新的曙光。
在研究过程中,研究人员运用了多种关键技术方法。首先,他们利用对比学习的特征选择技术,结合 ANOVA F 分数、XGBoost 和递归特征消除(RFE),自动确定食品掺假物的特征权重。其次,构建了包含食品样本、生产城市、检测城市和检测到的食品掺假物等节点类型的食品安全异构图,以此整合多维度特征。最后,引入基于元路径上下文的异构图神经网络(MECCH),通过自动发现关系构建上下文感知的元路径子图,有效捕捉多跳异质关系 。
下面来看具体的研究结果:
- 数据集处理与风险计算:研究人员使用了浙江大学国际数据分析与管理研究中心编制的食品安全检测数据集,涵盖约 260 万个食品检测样本。他们重点分析了 89,202 个不合格样本,通过严格筛选确保数据的可靠性。在风险计算方面,先基于特征选择计算掺假物权重,再通过多种标准化方法计算食品样本的风险值。例如,设计了合法性标准化方法,结合掺假物的检测值和合法阈值计算风险得分,避免了传统归一化方法的局限性。
- 模型构建与训练:构建的食品安全风险预测模型包含食品安全风险评估模块、食品安全图表示学习模块和风险预测器三个主要阶段。在模型训练中,以 80% 的数据为训练集,10% 为测试集,10% 为验证集,使用 Adam 优化器进行训练。通过与传统机器学习模型(如 XGBoost、随机森林(RF)、支持向量机(SVM))和其他异构图神经网络模型(如 HAN、MAGNN、GTN、HGT)对比,发现 MECCH 模型在多个评估指标上表现优异,如 Macro-F1 达到 0.3024,Micro-F1 达到 0.8544,准确率达到 0.8544 等。
- 实验验证与分析:在归一化对比实验中,自定义的合法标准化方法在风险值准确性和样本区分能力上优于非标准化和 Min-Max 标准化方法。通过消融研究发现,基于注意力的融合策略在整合多关系信息方面表现出色,优于简单平均、MLP-based 融合等其他策略。
研究结论表明,该研究提出的一系列创新方法有效解决了食品安全风险预测中的关键问题。自动分析食品掺假物权重的方法能精准识别关键风险因素,为食品生产过程中的原材料筛选和质量控制提供有力的数据支持。异构图构建方法整合了多源信息,准确捕捉了食品供应链中的复杂关系,为风险评估奠定了坚实基础。而上下文增强的 HGNN 模型在风险预测方面展现出卓越的性能,其评估结果可应用于智能食品采样、预警系统以及企业质量管理,对提升食品安全监管效率、降低检测成本具有重要意义。
不过,该研究也存在一定的局限性。例如,注意力机制在捕捉长距离依赖关系方面存在不足,类不平衡问题也未得到充分解决。未来的研究可以朝着引入更具表现力和可解释性的图表示学习框架方向发展,如结合异常检测机制或模糊聚类方法,以及明确建模监管感知传播机制,以进一步提升模型在复杂风险场景下的适应性和预测准确性,为食品安全风险控制提供更具价值的见解和技术支持。