-
基于模型检查的分布式系统引导式增量测试
摘要近年来,提出了基于模型检测的指导测试(MCGT)方法来系统地测试分布式系统。MCGT通过遍历从分布式系统的形式化规范中导出的整个已验证的抽象状态空间自动生成测试用例,并检查目标系统在测试过程中的行为是否正确。尽管MCGT非常有效,但使用它来测试分布式系统通常成本较高,且可能需要数周时间才能完成。当分布式系统发生变化时(例如引入新功能或修复错误),这种低效率问题会更加严重。我们必须为演化的系统重新运行整个测试过程以验证其正确性,这使得MCGT不仅资源消耗大,而且效率低下。为了降低分布式系统演化过程中基于模型检测的指导测试的开销,我们提出了iMocket,这是一种针对分布式系统的新型增量测试方
来源:Proceedings of the ACM on Software Engineering
时间:2025-11-07
-
利用 Kubernetes 自动扩展实现经济层面的可持续性阻碍
摘要现代云计算架构,尤其是基于Kubernetes(K8s)的应用程序,能够实现高度的灵活性和可扩展性。然而,这种优势也带来了相应的复杂性,尤其是在大规模、高响应速度的运行环境中。这种复杂性使得应用程序容易受到“经济可持续性拒绝”(EDoS)攻击的威胁。这类攻击旨在通过耗尽目标系统的资金支持来迫使其停止服务。据预测,到2025年底,公共云市场的规模将达到3750亿美元,因此这是一个亟待解决的问题。在本文中,我们建立了一个理论模型来分析针对K8s的EDoS攻击。我们基于马尔可夫决策过程(MDP)确定了扩展的阈值,考虑了运行K8s副本的成本、服务水平协议违规情况以及计费结构所规定的最低服务费用。在
来源:Proceedings of the ACM on Measurement and Analysis of Computing Systems
时间:2025-11-07
-
基于结构学习的社区检测鲁棒马尔可夫稳定性
摘要 社区检测是一种无监督的图节点聚类任务,在多个领域都有应用。常见的社区检测方法是通过优化目标函数,将节点划分为单一粒度的社区。然而,这些单一尺度的方法往往无法生成既稳健又符合实际需求的社区划分。现有的算法PyGenStability通过优化多尺度Markov稳定性函数来返回多个稳健的社区划分。但在不知道或用户未假设合适尺度的情况下,需要一种方法从PyGenStability生成的多个划分中选择一个合适的稳健划分。 我们提出的方法将Markov稳定性框架与预训练的机器学习模型结合,用于选择基于图结构确定的适当尺度
来源:Proceedings of the ACM on Human-Computer Interaction
时间:2025-11-07
-
DiskAdapt:基于预训练和微调的硬盘故障预测
摘要随着信息技术的快速发展,数据中心对存储设备的依赖程度越来越高。然而,这些设备遭受物理损坏的风险对数据安全构成了重大威胁。因此,故障预测技术对于提高存储系统的可靠性至关重要。目前的研究主要集中在使用机器学习或深度学习来分析硬盘的操作数据。然而,大多数方法都是基于单一硬盘模型进行训练和测试的,这导致故障检测的泛化能力不足。大型数据中心通常使用来自不同制造商和型号的硬盘,并且更换频率较高,这使得现有方法难以完全满足企业的需求。为了解决这些问题,本文提出了一种基于预训练和微调的硬盘故障预测模型,称为DiskAdapt。该模型采用了AdaptFormer架构,并利用预训练-微调框架来提取能够准确反映
来源:Proceedings of the ACM on Measurement and Analysis of Computing Systems
时间:2025-11-07
-
公平性调解器:中和刻板印象关联,以减少大型语言模型中的偏见
摘要大型语言模型(LLMs)在各种应用中表现出色,但它们无意中吸收了训练数据中的虚假相关性,导致有偏概念与特定社会群体之间存在刻板印象的关联。这些关联会加剧甚至放大有害的社会偏见,引发了对公平性的重大担忧,而公平性是软件工程中的一个关键问题。为了减轻这种偏见,以往的研究尝试在推理过程中将模型嵌入投影到无偏空间中。然而,由于这些方法与下游社会偏见的对齐度较低,其效果有限。我们受到以下观察的启发:LLMs中的概念认知主要通过线性关联记忆机制来表示,其中关键-值映射发生在MLP层中。我们认为,有偏概念和社会群体类似地被编码为实体(键)和信息(值)对,可以通过这种编码方式来促进更公平的关联。为此,我们
来源:Proceedings of the ACM on Software Engineering
时间:2025-11-07
-
防止系统备份因勒索软件攻击而受到破坏
摘要近年来,勒索软件对软件生态系统的威胁迅速增加。尽管对此已有大量研究,但新的勒索软件变种不断出现,这些变种旨在规避现有的基于加密的检测机制。本文介绍了Remembrall这一新的防御方法,它通过监控和防止系统备份中断来抵御勒索软件。Remembrall专注于Windows系统中卷影副本(Volume Shadow Copies, VSC)的删除操作,捕获相关的恶意事件,并实时识别所有勒索软件的痕迹。为了确保不遗漏任何勒索软件活动,我们对应用程序层、操作系统层和硬件层中可能用于删除VSC的所有攻击行为进行了全面分析。基于这些分析,Remembrall能够检索系统事件信息,并准确识别勒索软件,避
来源:Proceedings of the ACM on Software Engineering
时间:2025-11-07
-
PGTuner:一个用于自动且可移植配置调整的邻近图框架
摘要近似最近邻搜索(ANNS)在许多关键领域发挥着重要作用。邻近图(PGs)是ANNS的主要方法,它在查询效率和准确性之间提供了最佳的平衡。然而,它们的性能在很大程度上取决于各种构建和查询参数,而这些参数由于复杂的相互依赖关系而难以优化。鉴于用户通常会优先考虑特定的准确性水平,因此高效地识别出满足这些目标的最优PG配置至关重要。尽管一些研究已经探索了PGs的自动配置调整方法,但这些方法受到效率低下和结果不理想的限制。这些问题源于每次数据集发生变化时都需要从头开始构建大量的PGs并进行重新调整,以及未能捕捉到配置、查询性能和调整目标之间的复杂依赖关系。为了解决这些挑战,我们提出了PGTuner,
来源:Proceedings of the ACM on Management of Data
时间:2025-11-07
-
基于扩散的生成系统替代方案,用于虚拟游戏场中的可扩展学习驱动优化
摘要在本文中,我们介绍了DiffNEST,这是一个基于扩散的替代框架,用于在复杂的计算环境中实现可扩展的、以学习为驱动的优化。现代系统日益增加的复杂性往往使得传统的优化技术效率低下,而基于强化学习(RL)的方法则面临高昂的数据收集成本和硬件限制。DiffNEST利用扩散模型生成真实的、连续的系统轨迹,从而无需依赖物理硬件即可进行优化。DiffNEST生成的轨迹能够反映多样化的工作负载特征,有助于快速探索庞大的优化搜索空间。一个案例研究表明,与直接在物理硬件上训练的RL方法相比,DiffNEST可以加速实际优化任务,在任务感知的自适应DVFS方面实现了高达50%的改进,在多核缓存分配方面实现了1
来源:Proceedings of the ACM on Measurement and Analysis of Computing Systems
时间:2025-11-07
-
在点对点交易平台上的在线游戏玩家:从基础设施的角度看
摘要 近年来,用于交易虚拟游戏物品的第三方平台在中国迅速流行起来。这些平台不属于游戏公司,但仍允许玩家之间进行虚拟游戏物品的交易。然而,这些平台上交易的动机和行为方式在很大程度上尚未得到充分研究。为了解决这一空白,我们对从事虚拟物品交易的经验丰富的玩家进行了访谈,并通过主题分析来研究他们在这些第三方交易平台上的经历和行为。我们的研究发现,这些第三方平台已成为维护玩家游戏体验的重要组成部分,并将大量玩家转化为通过游戏赚取现金的交易者。此外,我们的研究还深入探讨了玩家在调和平台规则与他们对虚拟物品交易期望之间的矛盾时所做出的努力。
来源:Proceedings of the ACM on Human-Computer Interaction
时间:2025-11-07
-
异常值:好、坏与丑陋的面目
摘要本文研究了关系数据集D中的异常值对机器学习分类器M准确性的影响,特别是当使用D来训练和评估M时。异常值是指在统计上偏离大多数数据分布的数据点。我们区分了好的异常值(即新颖的数据)和坏的异常值(即由错误引入的数据),并将那些对特征具有显著影响的“丑陋”异常值与其他坏异常值区分开来。研究发现,只有“丑陋”的异常值会对M产生负面影响,而好的异常值(或其他类型的坏异常值)则分别会产生正面影响或可忽略的影响。为了减轻这种负面影响,我们提出了一类规则,称为OMRs(Outlier Mitigation Rules),通过嵌入机器学习异常值检测器和统计函数作为谓词来识别这些“丑陋”的异常值。我们开发了算
来源:Proceedings of the ACM on Management of Data
时间:2025-11-07
-
Perseus:实现强大的数据一致性和高数据更新频率,以支持可扩展的地理分布式HTAP架构
摘要 随着全球数据驱动应用的兴起,地理分布式混合事务处理和分析处理(HTAP)数据库变得越来越受欢迎。现有的分布式HTAP系统在事务处理和分析查询方面都能提供良好的性能,并且这种性能可以在大量数据节点上扩展。不幸的是,这些系统要么一致性较弱,要么在地理部署时会导致数据更新不及时。在本文中,我们介绍了Perseus,这是一种可扩展的HTAP数据库,它能够为事务处理和分析查询提供强一致性。为了高效地处理一致性问题,Perseus在并发控制协议中扩展了传统的依赖图,明确记录了数据的版本及其完整依赖关系,从而确定哪些数据需要一起在快照中读取。为了最小化分析查询中的数据
来源:Proceedings of the ACM on Management of Data
时间:2025-11-07
-
利用大型语言模型进行集体决策
摘要在各种工作场景中,如会议安排、协作和项目规划,集体决策至关重要,但由于成员之间的个人偏好差异、工作重点不同以及权力动态变化,集体决策往往具有挑战性。为了解决这一问题,我们提出了一种利用大型语言模型(LLMs)的系统,通过管理对话和平衡成员之间的偏好来促进群体决策。该系统旨在从每位成员与系统的对话中提取个人偏好,并提出满足这些偏好的选项。我们特别将此系统应用于企业会议安排。我们创建了合成的员工档案,并大规模模拟了对话,利用LLMs来评估该系统的性能,作为一种新颖的用户研究方法。研究结果表明,该系统能够实现高效的协调,同时减少了成员与基于LLM的系统之间的互动。随着时间的推移,系统不断优化和改
来源:Proceedings of the ACM on Human-Computer Interaction
时间:2025-11-07
-
绘制运动图谱:通过在线地图探索亚特兰大拟建的警察训练设施及其反对运动
摘要2021年,亚特兰大市政府和亚特兰大警察基金会联合计划在佐治亚州德卡尔布县(DeKalb County)的南河森林(South River Forest)建造一座大型警察训练设施。当时,亚特兰大和德卡尔布县的居民、环保活动人士、反对警察制度的人士以及其他关心此事的活动家和人士发起了反对该项目的运动,称为“停止警察城市建设/捍卫亚特兰大森林”(Stop Cop City / Defend the Atlanta Forest)运动。社交媒体和数字地图成为传播有关该设施和运动信息的常用工具。在这项研究中,我们分析了来自草根组织、亚特兰大市政府、新闻媒体、亚特兰大警察基金会和个人发布的关于该设施
来源:Proceedings of the ACM on Human-Computer Interaction
时间:2025-11-07
-
《POMACS V9, N2, 2025年6月》编辑专刊
摘要《ACM 计算系统测量与分析会议论文集》(POMACS)专注于计算机系统的测量与性能评估,并与 ACM 特别兴趣组 SIGMETRICS 密切合作。本期 POMACS 中的所有论文都将在 2025 年 6 月 9 日至 13 日于美国纽约州石溪市举行的 ACM SIGMETRICS 会议上进行展示。本期论文由 ACM SIGMETRICS 2025 项目委员会的 94 名成员通过严格的评审流程在冬季提交阶段选出。每篇论文都被有条件地接受(并得到指导),或者被允许在随后的两个 SIGMETRICS 提交截止日期之一重新提交;或者被拒绝(只有在一年后才能再次提交)。可用格式您可以通过以下格式查
来源:Proceedings of the ACM on Measurement and Analysis of Computing Systems
时间:2025-11-07
-
一个适用于所有情况的指数:实现针对每个阻尼因子的高效个性化PageRank计算
摘要个性化PageRank(PPR)是一种基本的图谱邻近度度量方法,具有广泛的应用场景。单源个性化PageRank(SSPPR)查询旨在计算给定源节点所有节点的PPR值。由于精确计算SSPPR的成本较高,大多数现有解决方案都侧重于具有精度保证的近似查询。现有的近似SSPPR查询方法基于索引,通常是为单一的固定α值设计的。然而,现实世界的应用往往需要处理多个α值,而现有的基于索引的方法在不重建索引的情况下难以适应不同的α值。为了解决这一限制,我们提出了一种新颖且高效的SSPPR查询索引方法,该方法支持所有α值。我们方法的一个显著特点是它仅为所有可能的α值存储一个索引。这是通过利用PPR的循环消除
来源:Proceedings of the ACM on Management of Data
时间:2025-11-07
-
CertainSync:具有确定性的无速率集合一致性机制
摘要集合一致性校验是分布式系统中的基本任务,尤其是在区块链网络中,它能够实现节点间事务池的同步并促进区块的传播。现有的传统集合一致性校验方案要么是基于统计的,通过通信开销和对称差异的大小来提供成功概率;要么需要参数化并估计对称差异的大小,但这容易出错。在本文中,我们提出了CertainSync这一新颖的校验框架,据我们所知,这是首个无需任何参数化或估计器即可保证集合一致性校验成功的框架。该框架具有无速率限制的特点,并能适应未知的对称差异大小。只要通信开销达到由对称差异大小和集合元素总数共同决定的下限,就能保证集合一致性校验的成功完成。我们的框架基于最近开发的可逆布隆查找表(Invertible
来源:Proceedings of the ACM on Measurement and Analysis of Computing Systems
时间:2025-11-07
-
《陷入交火:评估使用语言模型进行枪支暴力事件报告众包的效果》
摘要 枪支暴力是一个紧迫的人权问题,它几乎影响了社会结构的每一个方面,从医疗保健和教育到心理学和经济。关于枪支事件的可靠数据对于制定更有效的公共政策和应急响应至关重要。然而,由于缺乏全面的数据库以及面对面调查的风险,人权组织在大多数国家无法收集所需的数据。在这里,我们与一个巴西人权组织合作,对语言模型进行了系统评估,以帮助从社交媒体数据中监测现实世界的枪支事件。我们提出了一个基于BERT的微调模型,该模型在Twitter(现称为X)的文本上进行训练,以区分枪支暴力报告和普通葡萄牙语文本。然后,我们将该模型整合到一个网络应用程序中,并在实时干预中对其进行测试。我
来源:Proceedings of the ACM on Human-Computer Interaction
时间:2025-11-07
-
FreeWavm:一种基于解析树变异和快照引导的增强型WebAssembly运行时模糊测试工具
摘要WebAssembly 被认为是一种低级且可移植的语言,已在浏览器和区块链等多个领域得到广泛应用,成为推动互联网发展的革命性力量。然而,WebAssembly 运行时中的缺陷和漏洞会导致 WebAssembly 应用程序出现意外行为。为检测 WebAssembly 运行时的漏洞,人们提出了一系列解决方案,其中模糊测试(fuzzing)被认为是最有效的方法。尽管模糊测试具有巨大潜力,但由于 WebAssembly 运行时的语法复杂性以及对其基于模块的代码结构的缺乏深入了解,生成的有效测试输入难以触及其深层逻辑,从而限制了其发现漏洞的能力。为了解决这一问题,我们推出了 FreeWavm——一个
来源:Proceedings of the ACM on Software Engineering
时间:2025-11-07
-
超越静态模式匹配?在大型语言模型(LLMs)时代重新思考自动加密API误用检测机制
摘要尽管自动化检测加密API滥用技术已取得显著进展,但由于依赖手动定义的模式,对于复杂目标而言,其检测精度会下降。大型语言模型(LLMs)提供了基于上下文的理解能力,有助于弥补这一不足,但它们的随机性和“幻觉”问题给其在精确安全分析中的应用带来了挑战。本文首次系统地研究了LLMs在加密API滥用检测中的应用。我们的研究发现具有重要意义:直接应用LLMs会导致超过一半的初始检测结果为误报。尽管如此,通过将检测范围与实际场景对齐,并采用一种新颖的与分析验证技术,基于LLMs的检测可靠性可以得到显著提升,检测召回率接近90%。这一改进大幅超越了传统方法,并在已建立的基准测试中发现了此前未知的漏洞。然
来源:Proceedings of the ACM on Software Engineering
时间:2025-11-07
-
一种用于优化尾延迟的Gittins策略
摘要我们研究了在M/G/1排队系统中,如何在未知作业大小的情况下安排任务以最小化渐进尾延迟的问题。当作业大小分布具有重尾特性时,已知有许多不需要作业大小信息的调度策略(例如处理器共享、最小服务时间策略)具有很强的尾部分优性,这意味着它们的响应时间尾部具有最快的渐进衰减速度。相比之下,对于轻尾分布的作业大小,直到最近几年才出现了性能优于简单先来先服务(FCFS)的调度策略。其中最新的一种是γ-Boost,在轻尾环境下实现了强尾部分优性。然而,到目前为止,所有在轻尾环境下性能优于FCFS的策略(包括γ-Boost)都需要已知作业大小。在本文中,我们设计了一种新的调度策略,该策略能够在未知作业大小的
来源:Proceedings of the ACM on Measurement and Analysis of Computing Systems
时间:2025-11-07