基于图自动编码器的重要性采样法(GAE-IS):评估基础设施网络极端失效风险的新利器

【字体: 时间:2025年03月15日 来源:Patterns 6.7

编辑推荐:

  GAE-IS 方法利用图学习技术,有效降低计算成本,精准估算极端失效概率,评估基础设施韧性。

  ### 一、研究背景与挑战
在工程系统领域,极端事件(如极端天气、地震等)虽发生概率低,却能对交通网络、电网等关键基础设施造成灾难性影响。这些事件可导致基础设施瘫痪、经济损失惨重,甚至威胁国家安全。例如,强台风可能破坏输电线路,引发大面积停电;洪水会冲毁道路,阻断交通。因此,评估工程系统在极端条件下的可靠性至关重要,这是系统规划和设计的基础,有助于识别潜在风险,制定应对策略。
然而,传统方法在估算极端失效概率时面临诸多挑战。一方面,极端事件稀有,传统的蒙特卡罗模拟等方法计算成本高昂。以估算概率为、标准误差为 10% 的极端失效场景为例,需约数量级的样本量,模拟复杂非线性工程系统在众多失效场景下的性能极为困难。另一方面,常用的重要性采样(IS)方法虽能降低方差,但确定合适的重要性采样密度(ISD)难度大。在高维问题中,现有近似 ISD 的方法(如高斯混合模型、自适应核密度估计等)存在参数和样本量爆炸的问题,应用于大规模网络时计算成本过高。

二、GAE-IS 方法概述


为解决上述问题,研究人员提出了基于图自动编码器的重要性采样(GAE-IS)方法。该方法借助图学习技术,显著降低计算负担,提高极端失效概率估算的准确性,可用于评估多种城市基础设施(如电力、交通、供水系统)的韧性。

GAE-IS 方法具有两大核心优势。其一,通过图自动编码器(GAE)构建的临界性评估器具有可转移性。此评估器基于 GAE 框架,能评估网络组件对整体网络功能的临界性。在小规模子网络上训练后,可有效转移到大规模网络,无需在大网络上进行大量预采样即可确定 ISD 函数,且模型参数数量不受系统规模和变量维度影响,解决了传统 IS 方法在高维系统中的难题。其二,该方法在工作流程中解耦了组件的临界性与物理失效特征。将组件的脆弱性与潜在灾害的破坏强度空间分布相关联,结合结构脆弱性得到脆弱性分布。通过整合临界性分布与脆弱性分布,可导出 GAE-IS 的组件 ISD 函数,避免了自适应采样方法中因灾害类型或脆弱性分布变化而重新训练模型的问题。

三、GAE-IS 方法的具体实现


  1. 工作流程
    • 道路运输网络被视为由节点和链路组成的有向图。节点代表路口和出行需求的起点或终点,链路代表路段。研究采用平均出行时间(ATT)作为系统性能指标,以评估事件发生后的系统服务水平。ATT 通过公式计算,其中是网络总出行需求,是链路的交通流量,是链路的出行时间,由 Bureau of Public Roads(BPR)函数计算得出,是链路的自由流出行时间,是链路容量,分别取 0.15 和 4。
    • 研究设定链路存在空间异质的失效概率,并假设链路结构失效相互独立。极端失效场景定义为 ATT 超过阈值的情况。确定时,先通过粗蒙特卡罗方法采样个失效场景,然后用伽马分布拟合右偏的 ATT 或使用核密度估计处理多峰分布,将 ATT 分布的 99.75th 和 99.95th 百分位数作为极端失效阈值,实际应用中可根据需求调整。
    • 在训练网络中,使用粗蒙特卡罗方法随机采样个网络失效场景,选取部分导致网络性能大幅下降的样本作为风险场景。计算每个链路出现在风险场景中失效链路集合的可能性,以此调整链路的假设失效概率,进行迭代预采样,直至风险场景阈值超过
    • 临界性评估器根据道路网络的邻接矩阵和节点属性(包括拓扑中心性指标和交通流属性)学习每个链路对网络性能下降的影响特征表示,输出链路在风险场景中属于失效链路集合的可能性,量化链路的临界性。最后,根据链路临界性调整其结构失效概率,得到每个链路的 ISD 函数,进而确定失效场景的 ISD 函数。

  2. 临界性评估器
    • 临界性评估器基于 GAE 框架,输入包括网络的邻接矩阵和节点特征矩阵(由拓扑指标和交通流属性构成,每个节点用 12 维特征向量表示,数据预处理时进行标准化)。通过两层图卷积网络和两层全连接层进行编码,以链路容量作为边属性。
    • 由于交通网络中道路段的失效影响因方向而异,而传统 GAE 适用于无向图,研究采用 Ou 等人的方法,分别训练链路起点和终点的嵌入向量,以区分双向链路。训练时,为每个链路分配实值标签,通过最小化估计的链路可能性(节点嵌入向量的内积)与对应标签的误差来优化参数。

  3. 重要性采样理论基础
    重要性采样通过从引入的辅助分布中生成样本,增加特定样本的数量。对于估计(其中是名义分布,是被积函数),若是正概率密度函数,则,其中是重要性权重,是 ISD 函数。通过从中采样个实例,用样本均值估计期望,同时需满足(当时),以保证估计的无偏性。概率估计的方差(VPE)为,VPE 越高,数据点偏离均值越大,估计概率的稳定性越差。
  4. GAE-IS 方法的应用与评估
    • 研究在多个实际道路运输网络(如德国的 Berlin-Mitte-Prenzlauerberg-Friedrichshain-Center(BMPFC)、澳大利亚的北部 Gold Coast(NGC)、美国的 Anaheim 和 Chicago-Sketch(CS))上验证了 GAE-IS 方法的性能。实验前对网络数据进行预处理,如调整部分网络中连接器链路的容量,以确保模型的平衡训练。
    • 设置 GAE-IS 的参数(如链路失效概率、假设失效概率、采样次数等)和临界性评估器的超参数(如卷积层和全连接层的输出通道数、激活函数、损失函数等),通过交叉参考损失函数曲线和 VPE 曲线确定训练的停止 epoch。
    • 进行特征扰动实验,量化节点特征对模型估计链路临界性的影响。结果表明,节点的剩余容量是所有道路网络中最关键的特征,其次是通过节点的流量,这为理解网络关键链路提供了重要依据。


四、GAE-IS 方法的实验结果


  1. 采样效率提升
    与相同样本量的粗蒙特卡罗模拟相比,GAE-IS 在识别导致系统性能大幅下降的极端失效场景方面表现更优。在 BMPFC、Anaheim 和 NGC 网络中,GAE-IS 的 VPE 显著降低,采样效率分别提高了 82 倍、45 倍和 139 倍。同时,在子网络上进行预采样的计算时间比在原始网络上分别节省了 12 倍、9 倍和 19 倍,证明了临界性评估器的可转移性和 GAE-IS 方法在大规模网络中的可行性和有效性。
  2. 参数敏感性分析
    对参数进行敏感性分析发现,增加能增强 GAE-IS 捕获更多极端失效场景的能力,同时降低这些场景的 VPE。但较低时,GAE-IS 的概率估计与参考概率更接近,准确性更高;增加时,概率估计误差增大。这表明在有限样本量下,对概率估计准确性影响显著,实际应用中需权衡样本方差和估计准确性,通常较低的值(如 0.1 或 0.15)更有利于获得准确的概率估计。
  3. 异质链路失效概率下的应用
    将 GAE-IS 应用于芝加哥道路网络,考虑地震导致的路段失效概率(通过地理地震风险和路堤脆弱性曲线计算)。结果显示,GAE-IS 在采样极端失效场景方面明显优于粗蒙特卡罗方法,采样效率提高了 2 - 40 倍,在子网络上进行预采样的计算时间仅为原始网络的 1/32。这表明 GAE-IS 在处理空间异质链路失效概率场景时同样有效,且能根据地震风险变化轻松更新 ISD 函数,适用于不同的灾害场景,显著降低了重要性采样成本。

五、讨论与展望


GAE-IS 方法为估算大规模基础设施网络的极端失效概率提供了有效途径,尤其在交通系统中表现出色。其计算效率高,能有效解耦组件临界性与脆弱性,减少了模型训练和采样的成本。在不同类型的道路网络实验中,GAE-IS 均展现出良好的性能,为从极端值统计角度评估基础设施网络韧性提供了有力支持。

然而,GAE-IS 目前主要适用于成熟阶段的基础设施系统。当系统处于规划、建设或测试阶段,网络拓扑结构或出行分布模式发生显著变化时,需要重新训练模型。未来研究可探索 GAE-IS 在不同拓扑结构和需求分布网络中的可转移性,优化子网络选择标准,进一步提升其性能和应用范围。例如,研究人员可深入分析子网络与整体网络的结构和功能相似性,为选择更具代表性的训练网络提供理论依据,使 GAE-IS 能更好地应用于水分配系统、电网、通信系统等多种基础设施领域,助力构建更具韧性的城市和可持续发展的社区。

婵犵數鍋為崹鍫曞箰閹间緡鏁勯柛顐g贩瑜版帒鐐婇柍瑙勫劤娴滈箖鏌i悢鐓庝喊婵℃彃婀遍埀顒冾潐閹稿摜鈧稈鏅濋埀顒勬涧閵堟悂寮崒鐐村€锋い鎺嶇劍閻﹀酣姊虹拠鎻掝劉缂佸甯″畷婵嬪箳濡も偓缁€澶愭煟閺冨倸甯舵潻婵囩節閻㈤潧孝婵炶尙濞€瀹曟垿骞橀幇浣瑰兊閻庤娲栧ú銊╂偩閾忓湱纾介柛灞剧懅椤︼附淇婇锝囩煉鐎规洘娲熼、鏃堝川椤栵絾绁梻浣瑰缁诲倿鎮ч幘婢勭喓鈧綆鍠楅悡娆愮箾閼奸鍤欐鐐达耿閺屾洟宕堕妸銉ユ懙閻庢鍣崜鐔肩嵁瀹ュ鏁婇柣锝呮湰濞堟悂姊绘担钘変汗闁烩剝妫冨畷褰掓惞椤愶絾鐝烽梺绉嗗嫷娈曟い銉ョ墦閺屾盯骞橀懠顒夋М婵炲濯崹鍫曞蓟閺囥垹骞㈡俊銈咃工閸撻亶鏌i姀鈺佺仭濠㈢懓妫楀嵄闁圭増婢橀~鍛存煟濞嗗苯浜惧┑鐐茬湴閸婃洟婀侀梺鎸庣箓濡瑧绮堢€n喗鐓冪憸婊堝礈濮橆厾鈹嶉柧蹇氼潐瀹曟煡鏌涢幇銊︽珖妞も晝鍏橀弻銊モ攽閸℃瑥鈪靛┑鈽嗗灠椤戝寮诲☉銏犵闁瑰鍎愬Λ锟犳⒑鐠囧弶鍞夊┑顔哄€楃划姘舵焼瀹ュ懐顦ㄥ銈嗘尵婵兘顢欓幒妤佲拺閻犲洠鈧櫕鐏侀梺鍛婃煥妤犳悂鍩㈤幘璇茬闁挎棁妫勫▓銉ヮ渻閵堝棛澧紒顔肩焸閸╂盯寮介鐔哄幈濠电偛妫欓崝鏇㈡倶閳哄偆娈介柣鎰级閸犳﹢鏌熼姘毙х€殿噮鍣e畷鎺懳旀担瑙勭彃

10x Genomics闂傚倷绀侀幖顐﹀磹閻熼偊鐔嗘慨妞诲亾妤犵偞鐗犻垾鏂裤€掓刊鐖剈m HD 闂佽瀛╅鏍窗閹烘纾婚柟鍓х帛閻撴洘鎱ㄥΟ鐓庡付闁诲繒濮烽埀顒冾潐濞叉粓宕伴幘鑸殿潟闁圭儤顨呴獮銏℃叏濮楀棗澧┑顔煎暣濮婃椽宕ㄦ繝鍌滅懆濠碘槅鍋呯划宥夊Φ閺冨牆绠瑰ù锝囨嚀娴犮垽姊洪幖鐐插姉闁哄懏绮撻幃楣冩焼瀹ュ棛鍘遍棅顐㈡搐椤戝懏鎱ㄩ埀顒€鈹戦悙瀛樼稇婵☆偅绮撴俊鐢稿箛閺夊灝宓嗛梺缁樶缚閺佹悂鎮℃担铏圭=濞达絽鎲″﹢鐗堜繆閻愯埖顥夐摶鐐烘煕瑜庨〃鍛矆閸℃稒鐓曢柍鈺佸暈缂傛岸鏌嶈閸忔稓鍒掑▎鎾虫瀬鐎广儱顦伴弲鎼佹煥閻曞倹瀚�

濠电姷鏁搁崑娑樜涙惔銊ュ瀭闁兼祴鏅滃畷鏌ユ倵閿濆骸浜為柍缁樻閹鏁愭惔鈥崇缂備椒鑳跺▍澧俰st闂傚倷绶氬ḿ褍螞濡ゅ懏鏅濋柨婵嗘川缁犳柨顭块懜闈涘婵☆偅蓱閵囧嫰骞樼捄杞扮捕缂傚倸绉崇欢姘跺蓟濞戙垹鍐€闁靛ě鍐f嫛婵犵數鍋涢悧濠囧储椤ョSPR缂傚倸鍊烽悞锔剧矙閹烘鍎庢い鏍仜閻掑灚銇勯幒鍡椾壕濡炪倧缂氶崡鎶藉箖瑜斿畷顐﹀Ψ閵堝棗濯伴梻渚€鈧偛鑻晶鏉戔攽閳ユ剚鍤熼柍褜鍓ㄧ紞鍡涘礈濮樿泛姹查柍鍝勬噺閸婂灚绻涢幋鐐垫噧濠殿喖鍟撮弻娑㈠籍閹炬潙顏�

闂傚倷绀侀幉锟犮€冮崱妞曞搫饪伴崨顓炵亰闂婎偄娲︾粙鎺楀吹閸曨垱鐓熼柟閭﹀墻閸ょ喖鏌曢崼鐔稿唉妤犵偞鐗犲鍫曞箣閻樻鍞堕梻浣告啞閻熴儱螞濠靛棭娼栧┑鐘宠壘鎯熼梺闈涱檧缁茬厧霉閻戣姤鐓熼柣妯夸含閸斿秶鎲搁弶鍨殻闁诡喓鍎甸弫鎾绘晸閿燂拷 - 濠电姷鏁搁崕鎴犲緤閽樺鏆︽い鎺戝閻鏌涢埄鍐$細妞も晜鐓¢弻娑㈠焺閸愭儳姣€闂佸湱鍎ら幐楣冦€呴悜钘夌閺夊牆澧界粔鐢告煕鎼淬垹鐏ラ柍钘夘樀楠炴﹢顢涘顐㈩棜婵犵數鍋為崹鍫曞箹閳哄倻顩叉繝濠傚暟閺嗭箓鏌i弮鍥仩缁炬儳銈搁弻娑㈠焺閸愵厼顥濋梺鍛婃⒐鐢繝骞冨Δ鍛嵍妞ゆ挾鍋樺Σ鎰版⒑缂佹ḿ鈯曢柣鐔濆洤绠悗锝庡枛缁犳煡鏌熸导瀛樻锭闁诡喕绶氬娲川婵犲倻顑傛繝鈷€鍕垫疁鐎殿喗濞婇幃銏ゆ偂鎼达綆鍞规俊鐐€栭弻銊╂倶濠靛牏鐜绘繛鎴欏灪閻撴瑩鎮归妸銉Ц闁稿﹤顭烽幃鐑藉閵堝棛鍘卞┑鐐叉閿氶柣蹇嬪劜閵囧嫰顢曢姀鈺佸壎閻庤娲滄繛鈧€殿喕绮欓、鏍敃閿濆懏璇為悗娈垮枟閹倿寮幘缁樻櫢闁跨噦鎷�

婵犵數鍋為崹鍫曞箰閹间緡鏁勯柛顐g贩瑜版帒鐐婃い鎺嗗亾鏉╂繃绻濋悽闈浶㈤悗姘煎櫍閹本鎯旈妸锔惧幘閻庤娲栧ú銈嗙濠婂牊鐓曢柣鎰摠鐏忥箓鏌熼挊澶娾偓濠氬焵椤掑﹦绉甸柛鎾村哺椤㈡棃濡舵径瀣化闂佽澹嬮弲娑欎繆閾忓湱纾奸柕濞у喚鏆梺鐟板槻閹冲酣銈导鏉戠闁靛ě鈧崑鎾寸節濮橆厾鍘搁柣搴秵閸嬪嫭鎱ㄩ崼銉︾厸鐎光偓閳ь剟宕版惔銊ョ厺闁哄啫鐗嗛崡鎶芥煟濡寧鐝慨锝呭閺岋絾鎯旈姀鈶╁闂佸憡姊圭敮鈥崇暦濠靛鍋勯柣鎾冲閵夆晜鐓ラ柣鏇炲€圭€氾拷

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号