编辑推荐:
研究人员为解决应用机器学习研究地震断层时数据不足等问题,开展利用自动语音识别框架预测地震断层位移的研究。结果显示,Wav2Vec-2.0 模型预测效果良好,但未来预测能力有待加强。该研究为地震研究提供新方向。
在地震研究领域,长久以来,人们都渴望能更精准地预测地震,提前做好防范,减少生命财产损失。然而,研究地震断层面临诸多难题。多数大地震发生的间隔时间极长,从几十年到数千年不等,这使得地球物理仪器难以获取完整的加载周期数据,大多时候只能记录到其中一小部分。这就好比拼图缺了很多关键部分,科学家们难以从有限的数据中拼凑出地震断层的完整 “面貌”,也就无法准确把握地震的规律 。
在这样的困境下,美国洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)的研究人员 Christopher W. Johnson、Kun Wang 和 Paul A. Johnson 开展了一项极具创新性的研究。他们试图借助自动语音识别技术,为地震断层位移预测开辟新道路。研究成果发表在《Nature Communications》上,为地震研究领域带来了新的曙光。
为了实现这一目标,研究人员运用了多种关键技术方法。他们采用了 Wav2Vec-2.0 自监督框架,这是一种原本用于自动语音识别的技术。同时,利用夏威夷火山观测站(Hawai’ian Volcano Observatory)的永久地震网络和 GNSS 接收器获取数据,对模型进行训练和测试。通过网格搜索的方式,系统地测试不同输入输出窗口长度对模型预测能力的影响。
Wav2Vec-2.0 深度学习预测
研究人员将 Wav2Vec-2.0 模型应用于地震研究,该模型输入为连续地震波形,类似音频数据,训练目标是预测同期断层位移。模型通过卷积编码器层提取地震波形的层次特征,再经变压器块捕捉长程依赖关系,最后利用向量量化进行降维处理 。这种自监督学习的训练方式,让模型能从大量无标签数据中学习。
Wav2Vec-2.0 模型预测
- 同期位移预测:研究人员测试了多种输入地震和输出位移的时间窗口组合,发现输入窗口为 300 秒、输出窗口为 30 秒时预测效果较好。以 RIMD 站的地震波形数据预测 CRIM 站的 GNSS 地表位移为例,模型预测结果能较好地跟踪地面运动的变形周期,其 R2值达到 0.63,优于之前应用的梯度提升树模型(R2值为 0.59)。而且,Wav2Vec-2.0 模型在处理数据时无需像梯度提升树模型那样特殊处理非平稳性问题,能直接使用所有数据进行训练,泛化能力更强。
- 未来预测:研究人员重新配置并训练 Wav2Vec-2.0 模型,尝试预测未来 30 秒内是否会发生故障事件。同样通过网格搜索确定最佳输入输出窗口对,结果显示最佳模型的输入窗口为 300 秒,输出窗口为 30 秒,连续时间序列结果的 R2值为 0.62 ,与同期预测相似。但在实际预测未来滑动起始时间时,20 个事件中仅正确预测了 3 个,模型大多在故障事件发生后才预测到滑动,可靠性较低。
讨论
此前实验室研究表明,决策树和深度学习方法可从连续地震信号中映射同期断层摩擦。此次研究在此基础上更进一步,通过微调预训练的语音识别模型用于地震研究,不仅改进了之前决策树模型的结果,成功展示了 2018 年基拉韦厄火山口坍塌序列中地震信号包含加载周期中断层位移的特征,还首次实现了对滑动事件起始的预测,这是决策树模型无法做到的。
研究人员还发现,不同输入输出时间窗口对模型预测有影响,虽一般较长输入窗口表现更好,但短输入窗口在一定范围内也能接受。在预测 20 次地震故障中,除 3 次外其余都能较好预测,这是目前对地震断层同期滑动时间最可靠的预测。不过,对于未来位移预测仍存在困难,这可能是因为地震波形不包含相关特征,或者模型还不够完善。
这项研究意义重大,它让人们对跨时空尺度的断层滑动机制有了更深入的理解,证明了实验室和模拟剪切实验中开发的方法在活跃断层带同样适用,为后续研究指明了方向。未来,研究人员将继续探索新模型和新数据,致力于解决地震预测这一难题,为保障人类生命财产安全贡献力量。