Tracezip:通过trace压缩实现高效的分布式追踪

《Proceedings of the ACM on Software Engineering》:Tracezip: Efficient Distributed Tracing via Trace Compression

【字体: 时间:2025年11月07日 来源:Proceedings of the ACM on Software Engineering

编辑推荐:

  分布式追踪通过采样优化减少系统开销,但存在完整性权衡。Tracezip创新性地设计Span Retrieval Tree数据结构,在服务端压缩冗余追踪数据,后台通过共享数据重构完整轨迹,消除重复传输。实验证明其能显著提升追踪收集效率,同时保持原有API兼容性。

  

摘要

分布式追踪是监控和测试云服务系统的基本构建模块。为了降低计算和存储开销,实际操作中通常通过采样来捕获较少的追踪数据。然而,现有方法在追踪的完整性和系统开销之间存在权衡。一方面,基于头部信息的采样在请求进入系统时无差别地选择进行追踪,这可能会遗漏关键事件;另一方面,基于尾部信息的采样会先捕获所有请求,然后再选择性地保留边缘情况下的追踪数据,这会增加与追踪数据收集和存储相关的开销。本文提出了一种名为Tracezip的新方法,通过追踪数据压缩来提高分布式追踪的效率。我们的关键发现是追踪数据之间存在大量冗余,导致相同数据在服务端和后端之间被重复传输。我们设计了一种名为“Span检索树”(Span Retrieval Tree,简称SRT)的新数据结构,它在服务端持续消除这些冗余,并将追踪数据转换为更轻量级的形式。在后端,可以通过检索之前已传输的公共数据来无缝重建完整的追踪信息。Tracezip包含一系列策略来优化SRT的结构,并采用差异更新机制来高效地在服务端和后端之间同步SRT。在微服务基准测试、流行的云服务系统以及实际生产环境中的追踪数据上的测试表明,Tracezip能够在几乎不增加额外开销的情况下显著提升追踪数据的收集效率。我们已将Tracezip集成到OpenTelemetry Collector中,使其与现有的追踪API兼容。

可用格式

您可以通过以下格式查看完整内容:

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号