基于机器学习降阶模型和数据同化的混沌地震序列预测研究

《Geophysical Journal International》:Data Assimilation in Machine-Learned Reduced-order Model of Chaotic Earthquake Sequences

【字体: 时间:2025年12月17日 来源:Geophysical Journal International

编辑推荐:

  本研究针对物理模型与稀疏观测数据融合的难题,开发了一种基于机器学习的降阶模型(ROM),用于模拟混沌地震序列。通过本征正交分解(POD)和神经网络学习慢/快动力学,结合集合卡尔曼滤波(EnKF)进行数据同化,实现了对大地震时空演化的有效预测和不确定性量化。该框架为非线性地球物理系统的反问题提供了新途径,发表于《Geophysical Journal International》。

  
地震预测一直是地球科学领域的重大挑战。尽管基于速率-状态摩擦(RSF)定律的物理模型能够模拟真实的地震序列,但由于偏微分方程(PDE)模型与稀疏、低分辨率观测数据融合困难,利用这些模型进行地震预报面临巨大挑战。传统的物理模型计算成本高昂,且对观测数据中的高频噪声敏感,这限制了其在实际预报中的应用。
针对这些难题,加州理工学院的研究团队在《Geophysical Journal International》上发表了一项创新性研究。他们成功开发了一种基于机器学习的降阶模型(ROM),能够有效捕捉地震序列的慢/快混沌动力学特征。该模型通过低维表示实现计算高效性,并对观测数据中的高频噪声保持稳健。
研究人员采用本征正交分解(POD)技术从复杂数据集中提取主导模式,为滑动速率和状态变量分别建立低维表示。他们创新性地将时间变量变换,将慢/快动力学分离为两个神经网络分别学习:g1= dα/ds和1/g2= ds/dt,从而克服了学习多尺度混沌系统的困难。
为了进行数据同化,研究团队建立了包含前向模型和观测模型的完整框架。前向模型描述了降阶空间中地震周期的物理过程,而观测模型则将系统状态与可观测量联系起来。通过集合卡尔曼滤波(EnKF)方法,他们实现了对系统状态的顺序估计,即使面对稀疏和噪声污染的数据也能有效工作。

主要技术方法

本研究采用本征正交分解(POD)进行模型降维,使用神经网络学习慢/快动力学,建立包含前向模型和观测模型的数据同化框架,实施集合卡尔曼滤波(EnKF)进行状态估计,并通过长期统计比较验证模型性能。所有模拟均基于QDYN软件进行,机器学习部分采用全连接前馈神经网络结构。

3 结果

3.1 降阶模型组件与尺度特性

研究发现,POD能够有效提取滑动速率和状态变量的主导空间模式。前几个本征模捕获了大尺度空间特征,而更高阶的模则包含更精细的空间细节。选择20个模即可捕获超过90%的总方差,在准确性和计算效率之间取得了良好平衡。
ROM成功复现了原始PDE的关键尺度关系,包括古登堡-里克特震级-频率关系、矩-持续时间和矩-面积尺度定律。尽管存在轻微偏差和较大方差,但ROM整体上保持了原始系统的统计特性。

3.2 机器学习ROM的计算成本与效率

机器学习ROM显著降低了计算成本。在线模拟阶段,ROM在单个GPU上运行1000年仅需约15秒,而完整PDE求解器(QDYN)需要5073秒(11.27 CPU小时)。在墙钟时间上,ROM快了约338倍,总计算成本降低了约2700倍。

3.3 集合卡尔曼滤波

EnKF能够有效估计滑动速率的POD时间分量,即使在低通滤波造成的挑战下也能重建真实滑动速率。然而,状态变量(θ)分量的估计精度显著较低,不确定性更高,这是预期中的限制,因为状态变量分量无法直接观测。

3.4 事件预测

研究显示,ROM能够有效预测大事件(M > 6.9)的时间和空间演化。真正例比率(TPR)达到0.75,假正例比率(FPR)为0.13,显著优于泊松过程预测性能。空间预测方面,真正例范围比率(TPER)和假正例范围比率(FPER)表明预测在空间上是准确的,且能最小化错误预测。
然而,该方法对小事件(M < 6.9)的预测能力有限,主要是由于观测数据的平滑处理和小尺度过程的敏感性。

4 讨论

4.1 假设有效性与方法论局限性

研究采用了准动态近似,忽略了波动效应,这在慢滑移事件(SSE)模拟中是合理的,但对于快速破裂过程可能需要完全动态模型。另一个关键假设是模型参数完全已知,这限制了方法在真实场景中的直接应用。将模型参数作为神经网络的输入可能是未来的解决方向。
将ROM框架扩展到快速地震模拟面临额外挑战,包括更强的多尺度动力学和更高的训练数据需求。此外,数据同化的时间分辨率需要适应快速破裂过程,可能需要自适应时间步长策略。

4.2 可观测性

研究发现,原始全尺度模型可能是可同步的,仅通过观测滑动速率就能恢复状态变量。这一发现与实验室地震的机器学习预测结果一致,表明滑动速率是临近失稳的主要预测因子。如果这一关系得到普遍证实,将对数据同化和时变地震预测产生重要实际意义。

4.3 小事件预测

由于观测数据的平滑处理和ROM对小尺度过程的有限分辨率,准确表示和预测小事件特别具有挑战性。这与最近的研究一致,表明小地震由于其对小尺度应力非均匀性的敏感性而本质上更难预测。

4.4 不稳定性比率对可降维性的影响

不稳定性比率(断层尺寸与成核尺寸之比)在决定断层行为中起关键作用。研究发现,随着不稳定性比率的增加,高阶模的 eigenvalues 略有增加,但主导本征模的相对统计重要性基本保持不变。

5 结论

本研究成功开发了一种机器学习降阶模型,用于模拟混沌多尺度滑动事件序列。通过结合POD和机器学习,ROM有效捕捉了地震周期的主导动力学特征,显著降低了计算成本,同时保持了基本的尺度定律和统计特征。
ROM与集合卡尔曼滤波的成功集成为从稀疏噪声观测数据中估计POD时间分量提供了有效框架。尽管在状态变量分量重建方面存在一定不准确性,但集合平均预测能够可靠预测大事件的时间和位置。
该研究为模拟多尺度混沌事件序列提供了一个稳健高效的框架,展示了将物理信息机器学习与数据同化相结合在地震预测中应用的潜力。虽然当前实现是在合成环境中验证的,但其可扩展性、效率以及与真实观测数据的兼容性,为地震学实际应用提供了有前景的途径。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号