-
通过使用传统摄像机捕捉观众的三维面部和头部方向来评估演示效果的质量
摘要本文提出了一种利用观众面部和头部行为信息来评估演讲质量的方法。以往的研究主要通过分析演讲材料和演讲者的言语及非言语线索来评估演讲技巧。然而,由于演讲是演讲者与观众之间的互动过程,演讲质量不仅受演讲者自身因素的影响,还受到观众背景知识等观众因素的制约。这意味着仅依靠演讲者的表现无法对演讲进行全面评估。为了解决这一问题,我们提出了一种方法:该方法利用在演讲过程中使用两台摄像机录制的观众视频——一台从演讲者的视角拍摄,另一台则拍摄演讲屏幕周围的场景。通过面部检测技术识别出观众面部的三维位置和方向,并据此预测观众的目光焦点(如演讲者和演讲屏幕)。在演讲过程中,这些焦点被注视的次数被作为评估演讲质量
来源:Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies
时间:2025-11-07
-
Vinci:一种基于以自我为中心的视觉-语言模型的实时智能助手,适用于便携式设备
摘要我们提出了Vinci,这是一个视觉语言系统,旨在为便携式设备提供实时的、全面的AI辅助功能。Vinci的核心是EgoVideo-VL模型,该模型将以自我为中心的视觉基础模型与大型语言模型(LLM)相结合,实现了诸如场景理解、时间定位、视频总结和未来规划等高级功能。为了提升其实用性,Vinci配备了内存模块,可以实时处理长视频流并保留上下文信息;同时拥有生成模块,用于生成视觉动作演示;还有检索模块,能够连接以自我为中心的视角和第三人称视角,为用户提供相关的操作教程视频以帮助技能学习。与通常依赖专用硬件的现有系统不同,Vinci具有硬件无关性,可在包括智能手机和可穿戴相机在内的多种设备上部署。
来源:Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies
时间:2025-11-07
-
HT-Auth:通过细微的头部抖动实现安全虚拟现实头盔认证
摘要尽管虚拟现实(VR)应用程序近年来越来越受欢迎,但在VR设备上高效识别用户仍然是一个挑战。现有的认证方法,如密码和数字PIN码,依赖于手持控制器或空中手势,这些方法既耗时又不如在触摸屏或物理键盘上输入方便。更糟糕的是,输入过程可能被周围的人观察到,从而引发安全问题。在本文中,我们提出了一种名为HT-Auth的新颖认证方法,该方法基于微妙的头部颤动来实现VR设备的认证。这种颤动在人进行用力活动时自然产生,是人类无法避免的,可以通过商用VR头戴设备中内置的惯性传感器轻松捕捉到。因此,我们利用颤动信号提取颈部肌肉的生物特征来进行安全的VR设备认证。我们的实验使用了独立式和移动式VR头戴设备,仅需
来源:Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies
时间:2025-11-07
-
任务:利用动态更新的交通网络图进行短期交通流量预测
摘要实际道路网络的复杂拓扑结构以及交通流与时空因素的相互关联性,对传统的节点静态相关模型提出了挑战。为此,提出了DUTNG模型——一种利用动态更新的交通网络图进行短期交通流量预测的模型——以解决这些问题。首先,采用参数化的动态图学习模块对实时道路状况进行建模,增强了短期交通网络的表现能力。随后,将动态时间提取网络集成到动态图中,以便从不同时间范围的交通流中提取特征。此外,堆叠的动态空间提取网络模块解决了与区域影响变化相关的问题。最后,这三个模块依次集成,提高了模型提取时空相关性的能力。在真实世界数据集(加利福尼亚州高速公路网络)上的实验研究表明,该模型的性能显著优于机器学习模型。与最近的基准模
来源:Journal of Data and Information Quality
时间:2025-11-07
-
杰作创作:一种由人工智能驱动的机器人书法系统
摘要专业、互动、便携且低成本的书法教学工具对学习者来说至关重要。与传统面对面教学相比,这些工具使学习者能够随时随地进行练习。然而,大多数现有的书法教学工具侧重于在线指导,缺乏实时互动性,从而导致用户的学习效果不佳。为了解决这一问题,本文提出了“Masterpiece Creation”系统,这是一个专为书法教育设计的基于人工智能的机器人平台。“Masterpiece Creation”结合了先进的AI模型和路径优化算法,提供了诸如生成著名书法风格、互动教学以及语音引导交流等关键功能。此外,该系统还利用大型语言模型(LLMs)来进行学习者评估并提供自适应内容推荐。值得注意的是,该系统针对轻量级设
来源:Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies
时间:2025-11-07
-
RouteLLM:一款具备原生路线情境理解能力的大型语言模型,可实现基于情境的推理
摘要了解用户所处的环境对于判断他们的状态、需求以及与技术的互动方式至关重要。本研究重点关注路线背景信息,包括道路状况、交通状况和天气等影响用户出行的环境因素。将路线背景信息与大型语言模型(LLM)相结合,能够实现对这些环境因素的推理,从而让用户提出诸如“在我所走的路线上,什么时候打电话最合适?”或“这条路线适合开敞篷车行驶吗?”之类的问题。我们提出了首个能够原生理解路线背景信息的LLM——ContextualRoutes1。该数据集包含32万条路线信息,每条路线都涵盖了道路、天气和交通数据。我们使用特定模板及教师模型对这些路线进行标注,生成了LabeledRoutes1数据集,这是一个包含10
来源:Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies
时间:2025-11-07
-
基于描述符证明(Proof of Descriptor)的区块链可扩展性
摘要区块链网络采用共识机制,使参与者能够在无需依赖可信第三方的情况下交换交易。基于工作量证明(Proof of Work)的共识机制会消耗大量能量来选定区块矿工,这种延迟限制了系统的性能。其他共识机制,如权益证明(Proof of Stake)或实用拜占庭容错(Practical Byzantine Fault Tolerance),仍然需要指定一个单一的验证者来将区块添加到链中,从而无法实现区块的并行生成和发布。在本文中,我们提出了一种新的共识机制——描述符证明(Proof of Descriptor),该机制允许客户端通过使用描述符对象协作完成区块链交易的发布,该对象存储了关于交易并行执行
来源:Distributed Ledger Technologies: Research and Practice
时间:2025-11-07
-
Tracezip:通过trace压缩实现高效的分布式追踪
摘要分布式追踪是监控和测试云服务系统的基本构建模块。为了降低计算和存储开销,实际操作中通常通过采样来捕获较少的追踪数据。然而,现有方法在追踪的完整性和系统开销之间存在权衡。一方面,基于头部信息的采样在请求进入系统时无差别地选择进行追踪,这可能会遗漏关键事件;另一方面,基于尾部信息的采样会先捕获所有请求,然后再选择性地保留边缘情况下的追踪数据,这会增加与追踪数据收集和存储相关的开销。本文提出了一种名为Tracezip的新方法,通过追踪数据压缩来提高分布式追踪的效率。我们的关键发现是追踪数据之间存在大量冗余,导致相同数据在服务端和后端之间被重复传输。我们设计了一种名为“Span检索树”(Span
来源:Proceedings of the ACM on Software Engineering
时间:2025-11-07
-
在错误的考试中取得最高分:机器学习中用于漏洞检测的基准测试
摘要根据我们对机器学习在漏洞检测(ML4VD)领域的调查,在过去五年中发表的论文中,有90%将ML4VD定义为一种函数级别的二分类问题:给定一个函数,它是否包含安全漏洞?作为安全研究人员,我们在判断某个函数是否会使程序容易受到攻击时,通常首先希望了解该函数被调用的上下文。在本文中,我们研究了在没有额外上下文的情况下,这种判断在多大程度上是可行的,并研究了最流行的ML4VD数据集中的易受攻击函数和不易受攻击函数。如果一个函数被用于修复某个实际的安全漏洞,并且被证实导致了程序的漏洞,那么我们称该函数为易受攻击的;否则,我们称其为不易受攻击的。我们发现,在几乎所有情况下,这种判断无法在没有额外上下文
来源:Proceedings of the ACM on Software Engineering
时间:2025-11-07
-
关于串联队列中停留时间的分布
摘要本文研究了具有一般到达率和轻尾服务时间的串联队列中的(端到端)等待时间和停留时间。研究表明,相应分布的尾部受到多项式-指数上界的限制,其中多项式的次数取决于瓶颈队列的数量和服务时间的“轻尾性”。对于具有指数服务时间的双队列串联系统,所构建的封闭形式上界在数值上非常精确,比其他大偏差上界提高了多个数量级,并且在泊松到达率的情况下能够得到精确结果。可用格式您可以通过以下格式查看完整内容:PDF
来源:Proceedings of the ACM on Measurement and Analysis of Computing Systems
时间:2025-11-07
-
利用马尔可夫服务率策略改进多资源作业调度
摘要现代云计算工作负载由多资源作业组成,这些作业需要各种计算资源才能运行,例如CPU核心、内存、磁盘空间或硬件加速器。单个云服务器通常可以并行运行许多多资源作业,但前提是服务器具有足够的资源来满足每个作业的需求。因此,调度策略必须选择一组多资源作业进行并行运行,以最小化作业的平均响应时间——即从作业到达系统到完成作业的平均时间。不幸的是,通过选择能够充分利用可用服务器资源的作业集来实现低响应时间已被证明是一个难题。在本文中,我们开发并分析了一类新的多资源作业调度策略,称为马尔可夫服务率(MSR)策略。虽然之前的多资源作业调度策略要么分析起来非常复杂,要么难以实现,但我们的MSR策略实现简单,并
来源:Proceedings of the ACM on Measurement and Analysis of Computing Systems
时间:2025-11-07
-
微米级:共享集群中微服务之间的连接子集划分
摘要微服务应用程序通常采用一种称为“连接子集化”的技术来确保资源的高效利用和通信的稳定性。在这种技术中,上游容器通过持久连接将请求选择性地路由到下游容器中的一个有限子集。然而,微服务应用程序之间的相互依赖性以及复杂的运行时环境给有效的连接子集化带来了重大挑战,使得传统策略的效率显著降低。在本文中,我们提出了Microns,这是一个专为共享集群中的微服务设计的连接子集化框架。在应用程序层面,Microns能够有效处理应用程序中的复杂调用依赖关系,并精确计算每对依赖微服务之间需要维护的连接数量。在微服务层面,Microns根据它们对端到端延迟的贡献来管理这些依赖容器之间的连接关系。通过对微服务基准
来源:Proceedings of the ACM on Measurement and Analysis of Computing Systems
时间:2025-11-07
-
ALMOND:学习一种汇编语言模型,用于检测零次代码混淆行为
摘要代码混淆是一种用于保护软件的技术,它通过使代码难以理解和逆向工程来达到保护目的。然而,这种技术也可能被用于恶意目的,如代码剽窃或开发恶意程序。基于学习的方法在监督学习和标记训练集的帮助下取得了巨大成功。然而,当面对涉及私有开发且未公开的混淆器的现实环境时,这些监督学习方法在处理未见过的或未知类型的混淆技术时,其泛化能力和鲁棒性往往会受到质疑。本文提出了一种名为ALMOND的新方法,该方法可以用于检测二进制可执行文件中的代码混淆。与以往的监督学习方法不同,ALMOND在训练过程中不需要标记过的混淆样本。相反,它利用仅在未混淆的汇编代码上预训练的语言模型来识别混淆引入的语言差异。其核心创新在于
来源:Proceedings of the ACM on Software Engineering
时间:2025-11-07
-
LLM4SZZ:通过在大语言模型上进行基于上下文的评估来提升SZZ算法的性能
摘要SZZ算法是识别导致错误的提交(bug-inducing commits)的主要技术,为许多软件工程研究(如错误预测和静态代码分析)奠定了基础,从而提高了软件质量并促进了更好的维护实践。自该算法问世以来,研究人员提出了许多改进其性能的变体。这些变体大多依赖于静态技术或启发式假设,因此实现起来较为容易,但性能提升通常有限。最近,一种基于深度学习的SZZ算法被引入以改进原始算法。然而,这种新算法需要复杂的预处理过程,并且仅适用于单一编程语言。此外,虽然它提高了精确度,但牺牲了召回率(即检测到错误的比例)。此外,大多数变体忽略了关键信息,如提交信息(commit messages)和补丁上下文(
来源:Proceedings of the ACM on Software Engineering
时间:2025-11-07
-
FastFlow:利用最少时间序列数据包数量实现早期且稳健的网络流分类
摘要网络流量分类对网络运营商的日常工作至关重要,例如分析多媒体应用程序的使用模式和优化网络配置。提供高速连接的服务提供商(ISP)期望网络流量分类器能够尽早准确地对流量进行分类,并且使用的初始数据包数量尽可能少。这些分类器还必须能够抵抗候选流量中的数据包顺序异常(丢失和重传),并且能够检测到现有分类范围之外的未知流量类型,而现有方法在这方面做得并不好。在本文中,我们开发了FastFlow,这是一种时间序列流量分类方法,它可以准确地将网络流量分类为已知类型或未知类型,并动态选择最少的数据包数量以平衡准确性和效率。为了实现这些目标,我们首先开发了一种流量表示过程,该过程在每个数据包和每个时间槽的粒
来源:Proceedings of the ACM on Measurement and Analysis of Computing Systems
时间:2025-11-07
-
SSCard:利用后缀树引导的学习型FM索引进行子串基数估计
摘要 对子字符串查询的准确基数估计至关重要,这类查询通常使用SQL的`LIKE`操作符来表示。虽然已经开发了基于规则的方法和基于机器学习的方法来优化基数估计的各个方面,但由于这些方法缺乏误差范围,可能会导致较大的估计误差,从而产生次优的执行计划。在本文中,我们提出了SSCard,这是一种新颖的子字符串基数估计器,它将空间效率高的FM-索引应用于灵活的数据库系统中。SSCard首先扩展了FM-索引以自然地支持多个字符串,然后使用剪枝后的后缀树来组织FM-索引。后缀树结构能够实现对短模式的精确基数估计,并通过“pushup”操作实现
来源:Proceedings of the ACM on Management of Data
时间:2025-11-07
-
ForgetMeNot:理解并模拟永久性化学物质对可持续大规模计算的影响
摘要 氟化化合物,常被称为“永久性化学物质”,在半导体的制造过程中起着关键作用,如光刻、蚀刻、腔室清洗等步骤。这些化学物质的排放所造成的全球变暖潜力是二氧化碳的数千倍,并且会在大气中持续存在数千年。尽管它们的影响极其严重,但大多数关于计算机系统可持续性的研究都仅关注碳排放问题。我们通过引入ForgetMeNot这一建模工具来填补这一空白,该工具通过整合特定制造设施的实践和硬件规格来量化氟化化合物的排放量,并利用实际制造设施的排放数据进行准确性验证。我们展示了ForgetMeNot如何帮助制造设施优化设计和材料使用,从而减少排放;
来源:Proceedings of the ACM on Measurement and Analysis of Computing Systems
时间:2025-11-07
-
SieveSketch:一种用于精确频率估计的细粒度、自适应草图框架
摘要在数据流中估计项目频率是一项基础任务,它支持着广泛的应用场景。为了提高准确性,现有算法通常使用过滤器分别处理冷(不频繁出现)和热(频繁出现)的项目。然而,由于参数设置固定,这些算法在不同数据流上的准确性往往会下降。一旦过滤器达到其容量上限,就无法有效区分目标项目,从而导致准确性大幅下降。为了实现更高的准确性和更好的数据流适应性,我们提出了SieveSketch,这是一个用于数据流处理中的频率估计的新框架。SieveSketch借鉴了两个观察结果:一是冷项目频率范围较窄,二是项目对哈希碰撞的敏感度不同。该框架采用自适应缩放机制,通过少量比特(例如4比特)来调整每个计数器的计数范围,从而高效地
来源:Proceedings of the ACM on Management of Data
时间:2025-11-07
-
KRAKEN:程序自适应并行模糊测试
摘要并行模糊测试(Parallel Fuzzing)利用多核计算机加速模糊测试过程,在工业规模的软件缺陷检测中得到了广泛应用。然而,由于难以静态地预测模糊测试的运行时行为,为具有不同特性的程序制定高效的并行模糊测试策略颇具挑战性。现有的方法仍然针对各种程序使用预先定义的策略,导致性能不佳。在本文中,我们提出了KraKen——一种新的程序自适应并行模糊测试工具,通过动态策略优化来提高模糊测试效率。我们的关键发现是:在运行时,可以通过代码覆盖率变化等各种反馈来识别并行模糊测试中的低效之处,从而调整策略以避免无效的路径搜索,逐步逼近最优策略。基于这一思路,我们将寻找最优策略的任务视为一个优化问题,并
来源:Proceedings of the ACM on Software Engineering
时间:2025-11-07
-
扩展k-团渗透社区检测算法
摘要在现实世界的网络中,重叠社区非常普遍,节点通常会同时参与多个社区。k-团渗透社区(KCPC)模型是挖掘重叠社区的基本范式。然而,现有的KCPC挖掘方法往往受到效率低下和可扩展性挑战的制约,这限制了它们在大型网络中的应用。为了解决这些问题,我们从最大团和k-团的角度提出了几种新颖且高效的方法来挖掘KCPC。具体来说,我们首先提出了一种称为“准KCPC”的新概念,它代表了一个不完整的KCPC,并且可以在最大团枚举过程中作为副产品高效获得。基于准KCPC,我们首先提出了一种基于最大团枚举的解决方案,该方案在现有最大团邻接图遍历方法的基础上进行了改进,通过使用准KCPC大幅减少了最大团邻接图的规模
来源:Proceedings of the ACM on Management of Data
时间:2025-11-07