
-
生物通官微
陪你抓住生命科技
跳动的脉搏
护栏:从噪声数据中自动合成完整性约束
《Proceedings of the ACM on Management of Data》:Guardrail: Automated Integrity Constraint Synthesis From Noisy Data
【字体: 大 中 小 】 时间:2025年11月07日 来源:Proceedings of the ACM on Management of Data
编辑推荐:
数据质量问题长期困扰数据库领域,错误数据影响决策可信度。传统方法依赖功能依赖(FDs)约束检测但效果有限。本文提出基于领域特定语言(DSL)的约束程序,结合数据统计特性设计高效合成算法,在12个真实数据集上验证错误检测能力,并应用于48个ML-集成SQL查询,使平均错误率降低87%。开源框架Guardrail及数据集已开放[2]。