当前位置:首页 > 今日动态 > 科研动态/国外
  • 设计并构建了一种新的文件传输架构,旨在减少未被检测到的错误。该架构已在FABRIC测试平台上进行了评估

    摘要确保拍字节级别文件传输的完整性对于从科学仪器收集的数据至关重要。随着数据包大小的增加,出错的可能性也随之增加,从而导致数据包中未被检测到的错误概率上升。本文提出了一种多层错误检测(MLED)框架,该框架利用网络内部资源来降低文件传输中的未检测到错误概率(UEP)。MLED基于一种可配置的递归架构,该架构将通信组织为不同层次的层次结构,将网络功能(如错误检测、路由、寻址和安全)解耦。第i层的每个层次Lij都实现了一个策略Pij来控制其操作,包括该层次特定的错误检测机制。MLED可以配置为模仿现有的大规模文件传输协议的错误检测机制。通过对MLED的递归结构进行分析,发现增加额外的错误检测层次可

    来源:Proceedings of the ACM on Measurement and Analysis of Computing Systems

    时间:2025-11-07

  • 识别算法决策主体对有意义争议性的需求

    摘要可争议性(contestability)被提出作为设计算法决策过程的关键要素,这些过程旨在保护决策主体的尊严和自主权。然而,关于如何根据决策主体的需求和偏好来具体实施可争议性,目前知之甚少。我们通过识别决策主体在实现有意义的可争议性方面的信息和程序需求,来填补这一研究空白。为此,我们选择了非法假期房屋租赁检测这一案例作为研究对象——这是一个公共部门中的高风险决策过程。我们对有出租房屋经验且AI素养水平不同的公民进行了21次半结构化访谈。研究发现,决策主体要求采取以下措施:(1)促进意义构建的合作;(2)在争议过程中提供支持;(3)合理划分责任。我们的研究结果强调了可争议性背后的合作精神,并

    来源:Proceedings of the ACM on Human-Computer Interaction

    时间:2025-11-07

  • 马林(Marlin):用于云数据库管理系统(Cloud DBMS)自动扩展的高效协调机制

    摘要现代云数据库正从集成架构向存储分离架构转变,从而实现了计算资源和存储资源的独立扩展和计费。然而,云数据库的控制平面仍然依赖于外部集成协调服务(例如ZooKeeper)。这些服务实际上是专为处理少量元数据而优化的轻量级数据库。随着云环境中控制平面的扩展,这种架构同样面临着与集成数据库在存储分离之前相同的问题:可扩展性瓶颈、较低的成本效率以及增加的运营负担。我们提出将集群协调功能进行分离,以获得与存储分离为现代云数据库管理系统带来的相同好处。我们设计了Marlin,这是一种完全支持存储分离的云原生协调机制。Marlin通过将协调功能整合到其所管理的云原生数据库中,消除了对外部协调服务的需求。为

    来源:Proceedings of the ACM on Management of Data

    时间:2025-11-07

  • 通过缺失的语法引导转换机制来增强程序优化效果

    摘要程序简化是一种在语言处理器测试和调试中广泛使用的技术。给定一个会在语言处理器中引发错误的程序,程序简化会寻找一个经过规范化和最小化的程序,该程序也能引发相同的错误,从而有助于消除重复的错误并简化调试过程。为了在不牺牲通用性的前提下提高简化性能,以往的研究利用了编程语言的形式语法作为指导。为了增强这一过程,引入了两种基于语法的转换方法:兼容子结构提升(Compatible Substructure Hoisting)和量化节点简化(Quantified Node Reduction)。尽管这些转换在某种程度上被证明是有效的,但它们的应用过度地缩减了搜索空间,导致许多较小的解决方案无法被发现。

    来源:Proceedings of the ACM on Programming Languages

    时间:2025-11-07

  • “我一到这里就起荨麻疹”:在领英上如何应对平台带来的微侵犯行为

    摘要LinkedIn在寻找有偿工作以及建立职业人脉方面起着核心作用。在一个为希望通过中等薪酬的计算机相关工作实现社会经济地位提升的成年人设计的职业发展项目中,我们原本打算利用LinkedIn来寻找并建立新的社交关系。然而,我们无法将该平台用于这一目的。通过采用参与式研究方法,我们组建了一个具有不同背景的研究团队,以了解为什么LinkedIn难以使用,以及如何改进其功能以更好地服务于我们的项目。我们分析了录制的操作流程,并通过两年的民族志实地观察和书面反思来验证我们的发现。研究结果表明,LinkedIn内置的算法和界面设计更倾向于优先考虑那些拥有庞大社交网络且能够负担得起LinkedIn高级会员

    来源:Proceedings of the ACM on Human-Computer Interaction

    时间:2025-11-07

  • “我知道你们存在歧视!”:自动化证据支持对人工智能系统进行公平性审计

    摘要人工智能(AI)系统在人们的生活中发挥着越来越重要的作用,但它们频繁表现出的不公平行为引发了人们对公平性的担忧。为了揭示AI系统中的不公平现象,研究人员对这些系统进行了公平性审计。然而,现有的公平性审计工作往往侧重于群体公平性,而忽视了个体之间的歧视现象。为了揭示AI系统中对个体的歧视行为,本文提出了一种名为“substantiating”的个体公平性审计框架,该框架通过构建个体样本来识别AI系统中的歧视实例。在构建这些用于验证的样本时,审计人员通常需要依赖主观的先验知识,而目前缺乏关于如何生成不公平样本的指导原则。为了解决这一问题,本文介绍了两类自动化样本生成方法,这些方法能够在有限的系

    来源:Proceedings of the ACM on Human-Computer Interaction

    时间:2025-11-07

  • OmniGIRL:一个用于GitHub问题解决的多语言、多模态基准测试工具

    摘要GitHub问题解决任务旨在自动解决在仓库中报告的问题。随着大型语言模型(LLMs)的进步,这一任务受到了越来越多的关注,人们提出了多种基准测试来评估LLMs的问题解决能力。然而,现有的基准测试存在三个主要局限性。首先,当前的基准测试仅关注单一编程语言,限制了跨不同语言仓库问题的评估。其次,它们通常涵盖的领域范围较窄,可能无法反映现实世界问题的多样性。第三,现有基准测试仅依赖问题描述中的文本信息,忽略了问题中的多模态信息(如图像)。在本文中,我们提出了OmniGIRL,这是一个多语言、多模态、多领域的GitHub问题解决基准测试。OmniGIRL包含了959个任务实例,这些实例来自四种编程

    来源:Proceedings of the ACM on Software Engineering

    时间:2025-11-07

  • LPStream:用于流处理的细粒度延迟来源追踪机制

    摘要 流处理技术实现了实时数据分析。最新的流处理引擎(SPE)能够以分布式方式执行流处理,从而实时分析物联网设备和传感器产生的海量数据。该技术已被广泛应用于各种需要关键决策的应用场景中。为了解释流处理的结果,确保数据来源的可追溯性是不可或缺的。数据来源的可追溯性明确了处理过程中输入数据与输出数据之间的关系。通过可追溯性,我们可以了解哪些输入数据对最终输出结果产生了影响。现有的为流处理提供数据来源信息的框架通常在运行时生成可追溯性相关数据或额外信息。然而,这些方法会在常规流处理过程中带来较大的开销。在本文中,我们提出了一种名为LPStream的新框架,用于实现细

    来源:Proceedings of the ACM on Management of Data

    时间:2025-11-07

  • “我受够了这一切”:理解人们在社交媒体上公开自己日常遭遇种族主义事件时的不同角色与情境

    摘要在社交媒体上公开自己的经历变得越来越普遍,这为那些在现实生活中经历过种族主义的人提供了独特的帮助。虽然种族主义事件普遍会带来负面影响,但这些影响的体现方式因个人所扮演的角色以及事件发生的背景而异。揭示这些差异有助于我们理解种族主义对不同边缘化群体的普遍性和特殊性,以及他们在不同情境下的具体需求。本研究将关于在线自我披露的研究与种族主义经历的研究结合起来,以探讨在社交媒体上公开种族主义经历的角色和情境。我们采用“建构层次理论”(CLT),首先通过识别讲述者与施暴者和受害者之间的心理距离,将种族主义经历的叙述分为九个类别。在此基础上,我们对从子版块r/racism收集到的874篇帖子进行了内容

    来源:Proceedings of the ACM on Human-Computer Interaction

    时间:2025-11-07

  • “你怎么会知道那些知识的?”:电子表格用户之间专业知识共享的障碍

    摘要电子表格协作为同事之间的学习和专业知识分享提供了宝贵的机会。在组织内部保持重要的技术技能对于业务发展至关重要,但先前的研究表明,电子表格专家往往未能将他们的知识传播给他人。我们认为,围绕电子表格使用价值的社会规范和观念显著影响了用户参与分享行为的积极性。为了探究这一问题,我们对来自两个不同样本的专业电子表格用户进行了31次半结构化访谈。研究发现,电子表格供应商在将高度个性化的策略适应于通常具有主观性的标准方面面临挑战,同时在判断分享的适当时机上也存在困难。此外,人们对自身电子表格专业能力的自我评估存在矛盾,对这类知识价值的否定性看法,以及对协作可能带来的干扰的担忧,都可能进一步阻碍知识分享

    来源:Proceedings of the ACM on Human-Computer Interaction

    时间:2025-11-07

  • 医生:通过重新编排指令来优化容器重建效率

    摘要 容器化技术彻底改变了软件部署的方式,其中Docker因其易用性和一致的运行时环境而处于领先地位。随着Docker使用的增加,优化Dockerfile的性能(尤其是减少重建时间)对于维护高效的持续集成/持续交付(CI/CD)流程变得至关重要。然而,现有的优化方法主要针对单次构建进行优化,没有考虑到修改和演进过程中反复重建所带来的成本,这限制了长期效率的提升。为了解决这一问题,我们提出了Doctor这一方法,通过重新排序指令来提高Dockerfile的构建效率,该方法解决了几个关键挑战:识别指令之间的依赖关系、预测未来的修改、确保行为等效性以及管理优化的计算

    来源:Proceedings of the ACM on Software Engineering

    时间:2025-11-07

  • xFUZZ:一种灵活的框架,用于实现细粒度、运行时自适应的模糊测试策略组合

    摘要模糊测试(Fuzzing)是检测软件漏洞最有效的技术之一。现有的方法在不同目标系统上的性能表现存在差异,并且依赖于固定、粗粒度的模糊测试策略组合,这限制了在运行时灵活结合多种模糊测试策略的优势。为了解决这些问题,我们提出了一个灵活且可扩展的模糊测试框架,该框架支持细粒度、运行时自适应的策略组合。该框架将流行的输入调度和变异调度策略作为细粒度的、可独立切换的插件集成在一起,允许用户在整个模糊测试过程中动态替换任何插件。此外,我们还引入了一种基于滑动窗口汤普森采样(Sliding-Window Thompson Sampling)的自适应算法,该算法能够在测试过程中动态选择最佳的模糊测试策略组

    来源:Proceedings of the ACM on Software Engineering

    时间:2025-11-07

  • 基于上下文聚类的实体识别与大型语言模型的结合:设计空间探索

    摘要实体解析(Entity Resolution, ER)是一项基本的数据质量改进任务,旨在识别并关联指向同一真实世界实体的记录。传统的实体解析方法通常依赖于成对比较,这在时间和资金资源方面都可能非常耗费成本,尤其是在处理大型数据集时。最近,大型语言模型(Large Language Models, LLMs)在实体解析任务中展示了良好的性能。然而,现有方法大多仍侧重于成对匹配,未能充分利用LLMs直接进行聚类的潜力,而这种方式在成本效益和可扩展性方面具有更大优势。在本文中,我们提出了一种新颖的“上下文聚类”(in-context clustering)方法用于实体解析,该方法利用LLMs直接

    来源:Proceedings of the ACM on Management of Data

    时间:2025-11-07

  • 沙漏算法:一种采用轻量级混合编码的自适应范围滤波器

    摘要范围过滤器可以检查查询范围内的键集是否非空,同时保证没有误报(false negatives)且误报率较低。然而,现有的范围过滤器无法解决在数据分布不均或存在攻击性查询(adversarial queries)情况下频繁出现的误报问题。在本文中,我们提出了Hourglass这一自适应范围过滤器,它通过轻量级的混合编码技术和半排序(semi-sorted)适应性机制来防御重复的误报。Hourglass将键分为前缀部分(存储在半排序的Cuckoo过滤器中)和后缀部分(根据键的稀疏性采用混合编码方案进行编码)。通过保持指纹(fingerprints)的顺序,半排序的Cuckoo过滤器提高了空间效

    来源:Proceedings of the ACM on Management of Data

    时间:2025-11-07

  • “收获光芒,培育关怀:将间歇性作为基础设施构建与管理的框架进行探索”

    摘要为了应对人机交互(HCI)和设计领域日益增长的环境问题,业界和学术界最近的努力都集中在解决技术干预的可持续性和环境影响上。本文通过研究志愿者在“Solar Protocol”实验网络中管理太阳能服务器的实际经验来探讨这一议题。该实验网络是一个结合了创造性实践、可持续计算、生态意识以及社区关怀的分布式协作设计项目。通过访谈分析,并结合其他数据来源(观察记录、备忘录、通信记录等),我们研究了这些管理网络物理系统的工作者如何在不同地理环境中应对基础设施的间歇性问题并作出调整。我们重点关注了这一重构过程中所涉及的社会技术维度,因为系统的设计会影响到集体的维护工作。研究结果表明,管理间歇性供电的系统

    来源:Proceedings of the ACM on Human-Computer Interaction

    时间:2025-11-07

  • 《工作游戏的重现:仓库工人对算法化管理的体验》

    摘要算法被引入众多行业后,已经重新塑造了工作格局,并且这种趋势预计会持续下去。尽管越来越多的计算机支持协作工作(CSCW)研究开始关注工作未来的变化,但人们对除平台中介的零工劳动者之外的其他劳动者的经历知之甚少。在本文中,我们选取了亚马逊配送中心(FC)这一传统工作领域,以深入探讨算法管理对劳动者的实际影响。基于两年的民族志研究,我们展示了配送中心员工在面对管理者干预、强加的生产率指标以及劳动追踪系统时所采取的抵抗措施。将配送中心员工对算法系统和指标的抵抗行为置于当前计算机支持协作工作研究的框架内,有助于我们阐释这些具体实践与更广泛的算法控制机制之间的联系。此外,我们还指出,这些抵抗行为体现了

    来源:Proceedings of the ACM on Human-Computer Interaction

    时间:2025-11-07

  • 从用户调查到基于遥测数据的人工智能代理:探索个性化生产力解决方案的潜力

    摘要在现代工作场所中,信息工作者越来越面临生产力方面的挑战,他们在时间管理以及有效利用工作场所分析数据来提升工作效率方面遇到了困难。尽管企业工具提供了各种生产力指标,但员工往往无法将这些数据转化为可操作的见解。我们提出了一种以用户为中心的综合性方法,通过基于人工智能的生产力辅助工具来解决这些问题,这些工具是根据用户的需求量身定制的。我们采用了两阶段的方法:首先对363名参与者进行了调查,探讨了生产力、沟通风格、辅助工具的实施方式、人格特征、个性化以及隐私保护等方面的问题。基于调查结果,我们开发了一个由GPT-4驱动的个性化生产力辅助工具,该工具利用通过Viva Insights收集的信息工作者

    来源:Proceedings of the ACM on Human-Computer Interaction

    时间:2025-11-07

  • HotPrefix:一种基于热度感知的键值缓存调度机制,用于在大语言模型(LLM)推理系统中实现高效的前缀共享

    摘要提示工程(Prompt Engineering)技术被广泛用于提升大型语言模型(LLMs)的生成质量。然而,过长的提示会显著增加推理延迟并降低推理吞吐量。由于许多提示具有共同的前缀,因此提出了前缀共享(Prefix Sharing)机制,以便在推理过程中重用共享的前缀键值(KV)缓存。然而,由于前缀键值缓存的数量众多且GPU内存容量有限,将所有前缀键值缓存存储在GPU内存中并不现实。这一限制迫使人们采用外部存储策略,但传统方法往往会导致较高的I/O开销和频繁的缓存未命中现象。为了解决这些问题,本文提出了HotPrefix,这是一个基于热度感知的键值缓存调度框架,专为LLM推理系统中的高效前

    来源:Proceedings of the ACM on Management of Data

    时间:2025-11-07

  • HARMONY:一种可扩展的分布式向量数据库,用于高吞吐量的近似最近邻搜索

    摘要近似最近邻搜索(ANNS)在各种数据密集型应用中至关重要,包括推荐系统、图像检索和机器学习。将ANNS扩展到能够在单台机器上处理数十亿个高维向量时,会在内存容量和处理效率方面面临重大挑战。为了解决这些问题,分布式向量数据库利用多个节点来并行存储和处理向量。然而,现有的解决方案通常存在负载不平衡和高通信开销的问题,这主要是由于传统的划分策略未能有效分配工作负载。在本文中,我们介绍了一个名为Harmony的分布式ANNS系统,该系统采用了一种新颖的多粒度划分策略,结合了基于维度和基于向量的划分方法。这种策略确保了计算负载在所有节点之间的均衡分配,同时有效降低了通信成本。此外,Harmony还引

    来源:Proceedings of the ACM on Management of Data

    时间:2025-11-07

  • “父亲身份是一种独特的体验”:让父亲照顾工作得以被看见并置于具体背景中

    摘要关于母婴健康(MCH)的计算机支持协作工作(CSCW)研究主要从母亲或儿童的角度出发,设计技术以改善健康状况。近期的一些CSCW研究呼吁重新关注通过社会技术干预来支持护理人员,从而实现更好的健康结果。我们的研究以印度城市中的弱势社区为对象,将研究重点扩展到父亲及其在孕期和幼儿期的护理工作上。我们探讨了性别角色、宗教信仰、对社会流动性的期望以及经济责任如何影响父亲参与母婴健康工作的情况。通过定性研究,我们揭示了在父权制和社会规范的影响下,父亲在护理工作中所面临的限制,以及他们的护理工作如何因与传统护理观念的不同而变得不为人所重视。通过这种方式,我们扩展了这些环境中关于护理工作的主流认知,并讨

    来源:Proceedings of the ACM on Human-Computer Interaction

    时间:2025-11-07


页次:2742/9614  共192271篇文章  
分页:[<<][2741][2742][2743][2744][2745][2746][2747][2748][2749][2750][>>][首页][尾页]

高级人才招聘专区
最新招聘信息:

知名企业招聘:

    • 国外动态
    • 国内进展
    • 医药/产业
    • 生态环保
    • 科普/健康