
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于伪干预的局部到全局因果结构学习算法PICSL:高维数据下的高效因果发现新策略
【字体: 大 中 小 】 时间:2025年08月09日 来源:Neurocomputing 6.5
编辑推荐:
本文提出了一种创新的伪干预因果学习算法PICSL,通过生成多组伪干预子数据集(PID)模拟真实干预场景,结合相似性与定量权重评分函数,有效解决了传统因果结构学习(CSL)中干预实验成本高、数据噪声导致骨架不对称等问题。该算法在10个标准贝叶斯网络数据集上验证了其优越性,为医学、生物信息学等领域的高维因果推理提供了新思路。
亮点
本研究创新性地提出伪干预策略,通过扰动观测数据生成多组干预模拟数据集,显著提升了因果信号提取效率。实验显示,伪干预对目标变量PC集(父母-子女集)的分布扰动强度远超非因果变量(KL散度差异达3.7倍),这为低成本构建高精度因果网络提供了关键理论支撑。
讨论
真实干预(Real intervention)需通过物理实验切断变量间因果边,而伪干预通过数据层面的分布扰动实现类似效果。如图2所示,对变量Xi的伪干预会使其PC集变量(如Xj, Xk)产生显著分布偏移,这种特性被用于增强PC集识别。与传统AND/OR规则相比,本研究的阈值过滤策略将边缺失率降低42%,冗余边减少28%。
结论
PICSL算法通过集成多组伪干预子数据集和加权评分策略,在CHILD等复杂网络学习中F1值提升19.6%。该方法不仅规避了干预实验的伦理风险,还为小样本场景下的因果发现提供了鲁棒性保障,未来可拓展至基因调控网络等生命科学领域。
结论重申
(注:此处因原文第二个Conclusion部分内容与首个Conclusion高度重复,故合并翻译)本研究开创的伪干预框架为因果推理提供了高性价比解决方案,其核心创新——基于数据扰动的PC集增强技术和动态阈值筛选机制,已在模拟与真实数据集上展现出普适优势。
生物通微信公众号
知名企业招聘