基于时空因果推理的分布式系统异常检测：ICAD框架的高效性与可解释性突破

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年08月02日 来源：Engineering Applications of Artificial Intelligence 8

编辑推荐：

　　本文提出了一种融合时空因果推理（STCM）与结构因果模型（SCM）的分布式系统异常检测框架ICAD，通过格兰杰因果（Granger causality）建模时空依赖关系，实现了F1-score 0.92的检测精度（较基线提升11%）、0.01的低误报率及82%的噪声鲁棒性，为云计算、物联网（IoT）等场景提供可解释性强的根因分析（平均因果路径长度3.2）。

亮点
相关研究
本节回顾了传统异常检测方法（如孤立森林）、因果推理进展及时空模型，为时空因果模型（STCM）和集成因果异常检测（ICAD）框架奠定理论基础。

分布式系统时空因果模型
我们提出了一种创新性时空因果模型（STCM），精准捕捉分布式环境中组件间的时空依赖与因果结构，通过形式化系统交互关系构建异常分析框架。

基于因果推理的异常检测
基于时空因果图（STCG），本框架融合因果推理与时空分析，以数学严谨的参数定义实现高精度、可解释的检测，解决了传统方法对非线性交互和动态系统行为的建模局限。

鲁棒性与可解释性理论分析
通过理论推导证明ICAD在噪声（σ=0.5）下保持82% F₁-score（传统方法仅54%），并提供检测精度、计算复杂度的严格边界，其87.5%的根因定位准确率显著优于黑盒模型。

异常解释与根因分析
开发了基于STCG的可视化因果解释工具，能追溯平均长度3.2的因果路径，帮助管理员快速定位异常源头（如云服务链式故障）。

实验评估
在合成与真实数据集（如CLOUD-1）上的测试表明，ICAD的F₁-score达0.92，误报率仅0.01（系统负载20%时），且计算效率通过并行化与图剪枝优化提升3倍。

结论与展望
ICAD通过因果推理革新了分布式系统监控范式，未来将探索其在边缘计算实时诊断中的应用，并扩展动态因果图的自适应学习能力。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号