基于伪干预的局部到全局因果结构学习算法PICSL：高维数据下的高效因果发现新策略

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年08月09日 来源：Neurocomputing 6.5

编辑推荐：

　　本文提出了一种创新的伪干预因果学习算法PICSL，通过生成多组伪干预子数据集（PID）模拟真实干预场景，结合相似性与定量权重评分函数，有效解决了传统因果结构学习（CSL）中干预实验成本高、数据噪声导致骨架不对称等问题。该算法在10个标准贝叶斯网络数据集上验证了其优越性，为医学、生物信息学等领域的高维因果推理提供了新思路。

亮点

本研究创新性地提出伪干预策略，通过扰动观测数据生成多组干预模拟数据集，显著提升了因果信号提取效率。实验显示，伪干预对目标变量PC集（父母-子女集）的分布扰动强度远超非因果变量（KL散度差异达3.7倍），这为低成本构建高精度因果网络提供了关键理论支撑。

讨论

真实干预（Real intervention）需通过物理实验切断变量间因果边，而伪干预通过数据层面的分布扰动实现类似效果。如图2所示，对变量X_i的伪干预会使其PC集变量（如X_j, X_k）产生显著分布偏移，这种特性被用于增强PC集识别。与传统AND/OR规则相比，本研究的阈值过滤策略将边缺失率降低42%，冗余边减少28%。

结论

PICSL算法通过集成多组伪干预子数据集和加权评分策略，在CHILD等复杂网络学习中F1值提升19.6%。该方法不仅规避了干预实验的伦理风险，还为小样本场景下的因果发现提供了鲁棒性保障，未来可拓展至基因调控网络等生命科学领域。

结论重申

（注：此处因原文第二个Conclusion部分内容与首个Conclusion高度重复，故合并翻译）本研究开创的伪干预框架为因果推理提供了高性价比解决方案，其核心创新——基于数据扰动的PC集增强技术和动态阈值筛选机制，已在模拟与真实数据集上展现出普适优势。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号