沙漏算法:一种采用轻量级混合编码的自适应范围滤波器

《Proceedings of the ACM on Management of Data》:Hourglass: An Adaptive Range Filter with Lightweight Hybrid Encoding

【字体: 时间:2025年11月07日 来源:Proceedings of the ACM on Management of Data

编辑推荐:

  本文提出自适应范围过滤器Hourglass,通过轻量级混合编码和半排序自适应机制解决 skewed 或 adversarial 查询中的反复假阳性问题。其创新点包括前缀半排序布谷鸟过滤器、后缀混合编码及相关性感知空间分配模型,实验表明在对抗负载下性能提升达9.8-35.4倍,且在合成与真实数据集上表现稳健。

  

摘要

范围过滤器可以检查查询范围内的键集是否非空,同时保证没有误报(false negatives)且误报率较低。然而,现有的范围过滤器无法解决在数据分布不均或存在攻击性查询(adversarial queries)情况下频繁出现的误报问题。在本文中,我们提出了Hourglass这一自适应范围过滤器,它通过轻量级的混合编码技术和半排序(semi-sorted)适应性机制来防御重复的误报。Hourglass将键分为前缀部分(存储在半排序的Cuckoo过滤器中)和后缀部分(根据键的稀疏性采用混合编码方案进行编码)。通过保持指纹(fingerprints)的顺序,半排序的Cuckoo过滤器提高了空间效率。此外,Hourglass还引入了一种新的适应性策略,可以在不破坏半排序顺序的情况下更新指纹数据。同时,它还采用了基于键查询相关性程度的空间分配模型来优化空间利用。评估结果显示,在具有攻击性的工作负载下,Hourglass的性能优于现有的最先进范围过滤器,误报率降低了9.8至35.4倍。此外,实验证明Hourglass在合成数据集和真实世界数据集上均表现出良好的性能,并且能够适应不同的键查询相关性程度。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号