基于深度核学习的2000-2019年中国6小时0.1°分辨率冻雨数据集

【字体: 时间:2025年02月12日 来源:Scientific Data 5.8

编辑推荐:

  冻雨是一种极具破坏力的天气灾害,常发生于冬季和早春,会对电力、通信基础设施以及交通造成严重破坏,进而导致巨大的经济损失和人员伤亡。例如,2008 年中国南方的严重冰灾,大量电网和基础设施因冻雨覆冰受损,约 30% 的输电线路倒塌,数万个通信基站和电线杆被摧毁,农业、林业和自然保护区的野生动物也遭受重创,直接经济损失超过 200 亿美元。此外,气候变化改变了近 0°C 降水的可能性和频率,使得研究冻雨的发生、传播和变化机制变得更为迫切,高分辨率的冻雨数据集因此至关重要。

  

基于深度核学习的中国 2000 - 2019 年 6 小时 0.1° 分辨率冻雨数据集研究解读


北京师范大学国家安全与应急管理学院的研究人员 Junfei Liu、Kai Liu 和 Ming Wang 在《Scientific Data》期刊上发表了题为 “A 6-hourly 0.1° resolution freezing rain dataset of China during 2000–2019 based on deep kernel learning” 的论文。这一研究成果意义重大,其构建的高分辨率冻雨数据集为气象学、气候学以及灾害管理等多领域研究提供了关键数据支撑,极大地推动了对冻雨现象的深入理解与应对策略的发展。


一、研究概述


冻雨是一种极具破坏力的天气灾害,常发生于冬季和早春,会对电力、通信基础设施以及交通造成严重破坏,进而导致巨大的经济损失和人员伤亡。例如,2008 年中国南方的严重冰灾,大量电网和基础设施因冻雨覆冰受损,约 30% 的输电线路倒塌,数万个通信基站和电线杆被摧毁,农业、林业和自然保护区的野生动物也遭受重创,直接经济损失超过 200 亿美元。此外,气候变化改变了近 0°C 降水的可能性和频率,使得研究冻雨的发生、传播和变化机制变得更为迫切,高分辨率的冻雨数据集因此至关重要。


当前,冻雨研究面临诸多挑战。气象站数据稀疏,用于研究冻雨关键高空条件的探空站数量有限;遥感数据集的空间分辨率通常低于 0.5°,相对粗糙,不利于精确评估冻雨灾害风险,且数据存储和处理难度较大。机器学习虽在生成高分辨率数据集方面有一定潜力,但存在预测过度自信和低估不确定性的问题。高斯过程虽能提供可靠的不确定性估计,但多数内核难以从数据中有效学习特征表示。在此背景下,深度核学习(DKL)应运而生,它结合了深度学习和高斯过程的优势,为冻雨数据集的构建提供了新途径。


二、研究材料与方法


(一)数据来源


研究数据主要来源于中国气象局(CMA)和 ERA5 再分析数据。CMA 提供了 2000 年 1 月至 2019 年 12 月期间,2168 个地面气象站在世界协调时(UTC)00:00、06:00、12:00 和 18:00 的观测数据,包括地表温度(Tas)、露点温度(DT)、风速(WS)、海拔、总降水量(TP)、相对湿度(RH)和湿球温度(Tw)等。ERA5 提供了 0.1° 分辨率的 DT、TP、10m 风的 V 分量和 U 分量、地表压力(SP)等陆地每小时数据,以及不同气压层(400hPa - 975hPa)的温度、相对湿度、比湿(SH)、垂直速度(VV)等数据。此外,研究还从 Google Earth Engine 下载了数字高程模型(DEM)数据,并将其重采样至 0.1°。


(二)数据预处理


对获取的数据进行了一系列预处理操作。利用 10m 风的 V 分量和 U 分量加权平均计算 WS;根据 Tas 和 DT,运用 Magnus 公式计算地表 RH;借助 Python 的 psychrolib 包,通过 Tas、RH 和 SP 计算 Tw;依据特定公式计算 850hPa 等压面上的相当位温( )。同时,为构建网格化数据集,假设包含冻雨事件的网格单元能代表该网格的天气现象,并从所有地面气象站冬季数据中随机选取 21,435 个非冻雨事件,使非冻雨事件与冻雨事件的比例保持为 3:1。


(三)技术路线


研究的技术流程主要包括数据准备、模型训练与事件分类、结果验证三个部分。首先,将选定的冻雨事件和随机采样的非冻雨事件与 ERA5 数据整合,构建训练和验证数据集。然后,运用深度核学习(DKL)模型进行训练。DKL 模型以 9 层 ResNet 作为内核,将环境背景变量映射到冻雨的发生或不发生,再通过高斯过程进行概率推断。训练过程中采用 5 折交叉验证,并添加 dropout 层和 L2 正则化防止过拟合。最后,使用 Ramer Scheme 和 ERA5 的 PT、TP 数据对模型结果进行验证,并通过敏感性和不确定性分析测试 DKL 模型的稳健性。


三、研究结果


(一)数据记录


研究生成的数据集具有 0.1° 的空间分辨率(约 11.1 千米)和 6 小时的时间分辨率,涵盖了 2000 年 1 月 1 日至 2019 年 12 月 31 日中国的网格单元。数据以 CSV 文件格式存储,包含年份、月份、日期、小时、纬度、经度、冻雨事件的环境条件因子以及中国的七个地理区域等信息。这些数据可用于进一步分析气候遥相关的影响和风险评估。


(二)技术验证


  1. 时间性能分析:排除 TP 小于 0.1mm 的冻雨事件后,分析发现冻雨事件在 1 月和 2 月更为频繁。1 月,中国西南部、中部和东南部地区冻雨事件较多;2 月,西北部地区冻雨事件增多。DKL 模型在 2000 - 2019 年的月度尺度上表现稳健,各月的准确率和 AUC 均高于 0.95,多数月份的召回率和精确率也高于 0.95,仅有两个月的精确率和召回率低于 0.9。

  2. 垂直温度剖面验证:冻雨的形成与气温垂直剖面密切相关。对 2000 - 2019 年各区域随机抽样的分类冻雨事件的垂直剖面分析显示,中部、东南部和南部地区存在典型的冻雨形成条件,即有温度高于 0°C 的暖层和近地表的冷层。西南部地区在 800hPa - 975hPa 有明显较宽的暖层,有利于冻雨形成。西北部地区垂直剖面与西南部相似,北部地区在 875hPa - 975hPa、东北部地区在 850hPa - 975hPa 也存在暖层,这些结果与现有研究相符。

  3. 模型性能比较:DKL 模型的平均性能指标表现出色,准确率达到 0.991,AUC 为 0.999,召回率为 0.973,精确率为 0.989。相比之下,Ramer Scheme 在训练数据集上的 AUC、准确率、召回率和精确率分别为 0.932、0.933、0.929 和 0.827。在 2008、2011 和 2018 年严重冻雨发生的年份,对比 DKL 模型和 Ramer Scheme 的预测结果发现,DKL 模型在预测冻雨方面表现更优,其预测结果与实际灾害情况更为相符。

  4. 与 ERA5 数据对比及不确定性分析:将 DKL 模型与 ERA5 数据对 2024 年冬季冻雨事件的分类结果对比,DKL 模型表现更优。通过分析不同训练 - 验证集和不同条件因子堆叠顺序下的模型结果,进行敏感性和不确定性分析,结果表明 DKL 模型的评估指标波动较小,概率预测稳健,能够稳定地对冻雨事件进行分类,避免预测模糊结果。


四、研究结论与讨论


研究人员基于深度核学习构建了 2000 - 2019 年中国 0.1° 分辨率、6 小时时间间隔的冻雨数据集,有效填补了相关数据空白。DKL 模型在处理复杂大气条件下的冻雨分类和预测任务中表现卓越,相比传统的 Ramer Scheme,在准确率、AUC、召回率和精确率等指标上均有显著提升。通过对不同年份冻雨事件的验证以及与 ERA5 数据的对比,充分证明了 DKL 模型的可靠性和优越性。此外,敏感性和不确定性分析进一步验证了 DKL 模型的稳健性,其能够稳定地对冻雨事件进行分类,为研究提供了可靠的结果。


这一研究成果在多领域具有重要意义。在学术研究方面,为气候学、气象学等领域深入探究冻雨的形成机制、时空变化规律提供了高质量的数据基础,有助于学者更好地理解冻雨现象与气候变化之间的关系。在实际应用中,为天气预报提供了更精确的数据支持,提高了冻雨预报的准确性,有助于提前制定防范措施,减少灾害损失;在气候建模方面,有助于构建更精准的气候模型,提升对气候系统的模拟和预测能力;在灾害管理领域,为灾害风险评估和应急决策提供了有力依据,能够更科学地规划防灾减灾策略,保障社会经济的稳定发展。


濞戞挸顑堝ù鍥┾偓鐟邦槹瀹撳孩瀵奸敂鐐毄閻庢稒鍔掗崝鐔煎Υ婵犲洠鍋撳宕囩畺缂備礁妫滈崕顏呯閿濆牓妯嬮柟娲诲幘閵囨岸寮幍顔界暠闁肩瓔鍨虫晶鍧楁閸撲礁浠柕鍡楊儐鐢壆妲愰姀鐙€娲ゅù锝嗘礋閳ь剚淇虹换鍐╃閿濆牓妯嬮柛鎺戞閻庤姤绌遍崘顓犵闁诡喓鍔庡▓鎴︽嚒椤栨粌鈷栭柛娆愬灩楠炲洭鎯嶉弮鍌楁晙

10x Genomics闁哄倹婢橀幖顪渋sium HD 鐎殿喒鍋撻柛姘煎灠瀹曠喓绱掗崱姘姃闁告帒妫滄ご鎼佹偝閸モ晜鐣遍柛蹇嬪姀濞村棜銇愰弴鐘电煁缂佸本妞藉Λ鍧楀礆閸℃ḿ鈧粙鏁嶉敓锟�

婵炲棎鍨肩换瀣▔鐎n厽绁癟wist闁靛棗锕g粭澶愬棘椤撶偛缍侀柛鏍ㄧ墱濞堟厤RISPR缂佹稒鐩埀顒€顦伴悧鍝ヤ沪閳ь剟濡寸€n剚鏆╅悗娑欏姃閸旓拷

闁告娲滅划蹇涙嚄閻愬銈撮幖鏉戠箰閸欏棝姊婚妸銉d海閻犱焦褰冮悥锟� - 婵烇絽宕崣鍡樼閸℃鎺撶鎼达綆鍎戝☉鎾亾濞戞搩浜滃畷鐔虹磼閸℃艾鍔掗悗鍦仱閻涙瑧鎷嬮幑鎰靛悁闁告帞澧楅弳鐔煎箲椤斿灝绐涢柟璨夊倻鐟㈤柛娆樺灥椤宕犻弽顑帡寮搁敓锟�

濞戞挸顑堝ù鍥Υ婵犲嫮鐭庨柤宕囧仜閸炴挳鎽傜€n剚顏ら悹鎰╁妺缁ㄧ増鎷呭⿰鍐ㄧ€婚柡瀣姈閺岀喎鈻旈弴鐘虫毄閻庢稒鍔掗崝鐔煎Υ閿燂拷

相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普
    • 急聘职位
    • 高薪职位

    知名企业招聘

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号

    闁汇垻鍠撴晶鍧楁焻濮樿京缈辩憸鎵虫櫆鐢綊鎳¢敓锟� • 多功能纳米平台:开启肿瘤免疫治疗新篇章 • 《Cell》亚洲免疫细胞多样性研究:解锁健康与疾病的遗传密码