编辑推荐:
为解决滑坡易发性制图中,非滑坡样本选择不确定性和模型超参数优化问题,研究人员开展基于多样本标签学习(MSLL)和梯度优化器(GBO)优化 BP 神经网络模型的研究。结果显示该方法能提升模型性能,为滑坡防治提供参考。
滑坡,作为山区常见的地质灾害,就像隐藏在大地深处的 “定时炸弹”,时刻威胁着人类的生命和财产安全。在全球范围内,滑坡频繁发生,其强大的破坏力、广泛的分布范围以及极强的隐蔽性让人防不胜防。中国,更是深受其害,每年一些地区都会发生数十甚至上百起滑坡事件,造成惨重的人员伤亡和巨大的财产损失。
面对滑坡灾害带来的严峻挑战,滑坡易发性制图(Landslide Susceptibility Mapping,LSM)成为了预防和减轻灾害损失的关键手段。它通过综合考量某一地区的地理和环境因素,评估地质环境和自然条件对滑坡形成的影响,进而确定滑坡易发性等级,为灾害防治提供科学依据。然而,目前滑坡易发性制图面临诸多难题。一方面,在选择非滑坡样本时存在很大的不确定性,样本的代表性和准确性难以保证,这极大地影响了模型的学习能力和最终预测的准确性。另一方面,在模型构建中,像反向传播神经网络(Back Propagation Neural Network,BPNN)等模型的超参数选择至关重要,但传统手动调整超参数的方式效率低下且依赖专家经验,同时对模型泛化能力的系统评估也有所欠缺,这些问题严重限制了模型的实际应用和推广。
为了攻克这些难题,来自国内的研究人员开展了深入研究。他们提出了一种基于多样本标签学习(Multi - Sample Label Learning,MSLL)的非滑坡样本选择方法,并利用梯度优化器(Gradient - based optimizer,GBO)算法对 BPNN 模型的超参数进行优化。研究选取了贵州省思南县作为研究区域,旨在通过一系列实验和分析,探索出更精准、可靠的滑坡易发性制图方法。
研究过程中,研究人员运用了多种关键技术方法。首先是数据收集和预处理,收集了 167 个历史滑坡事件数据以及 12 个评估因子构建空间数据库。在非滑坡样本选择上,采用缓冲控制采样(Buffer Control Sampling,BCS)和 MSLL 两种方法。接着,使用 GBO 算法对 BPNN 模型的 3 个超参数,即隐藏层数、训练轮数(Num_epochs)和学习率进行优化。最后,通过受试者工作特征曲线(ROC 曲线)、混淆矩阵、准确率、精确率、均值和标准差等指标对模型进行评估。
研究结果
- 评估因子相关性分析:基于皮尔逊相关系数(PCC)对 12 个评估因子进行相关性分析,结果显示所有评估因子的 PCC 值最高为 0.41,最低为 - 0.47,绝对值均小于 0.5,表明各评估因子之间呈弱相关,均可用于滑坡易发性建模。
- 不同非滑坡采样策略的影响:分别使用 BCS 方法和 MSLL 方法选择非滑坡样本,通过 ROC 曲线精度验证、混淆矩阵以及易发性指数均值和平均值的结果发现,非滑坡样本的选择对模型的准确性和可靠性至关重要。与 BCS 方法相比,MSLL 方法使训练和测试样本的曲线下面积(AUC)提高了约 3%,这表明 MSLL 方法选择的非滑坡样本更可靠。
- GBO 优化的效果:GBO 算法对 BPNN 模型进行超参数优化后,训练样本的 AUC 进一步提高了 4%,测试样本的 AUC 提高了 3%,充分证明了超参数优化对提高模型准确性的重要性。
研究结论与讨论
本研究成功提出了基于 MSLL 的非滑坡样本选择方法和 GBO 优化 BPNN 模型超参数的框架,并通过与常用的 BCS 采样方法对比分析,验证了其有效性。研究表明,MSLL 方法有效降低了非滑坡样本选择的不确定性,GBO 优化显著提升了 BPNN 模型的性能。该研究成果为滑坡易发性制图提供了更科学、准确的方法,生成的易发性分类图能为当地灾害预防和减轻提供重要参考,在地质灾害防治领域具有重要的应用价值,有助于更好地保障人民生命财产安全,降低滑坡灾害带来的损失。