-
基于上下文的自动编码图神经网络模型,用于利用自然语言处理(NLP)进行动态问题生成
摘要问题生成是自然语言处理中的一个重要任务,它涉及从给定文本生成问题。本文提出了一种基于上下文感知的自动编码图神经模型的动态问题生成新方法。我们的方法首先构建输入文本的图表示,其中图中的每个节点对应文本中的一个单词或短语,边则表示它们之间的关系。然后,我们使用自动编码器模型来学习图的压缩表示,以捕捉输入文本中的最重要信息。最后,我们利用压缩后的图表示通过动态选择与输入文本上下文相关的节点和边来生成问题。我们在四个基准数据集(SQuAD、Natural Questions、TriviaQA 和 QuAC)上评估了我们的方法,并证明了它在动态问题生成方面优于现有的最先进方法。在实验中,我们使用了四
来源:ACM Transactions on Asian and Low-Resource Language Information Processing
时间:2025-11-08
-
CCCS:利用代码图信息进行对比性跨语言代码搜索
摘要 在软件开发过程中,开发人员经常搜索和重用现有的代码片段以提高开发效率。目前,研究人员已经提出了许多代码搜索方法。然而,这些方法的搜索意图基本上是基于自然语言的查询。为了支持代码迁移和代码重构,需要将一种编程语言的代码片段与另一种编程语言的代码片段进行匹配。在本文中,我们提出了一种利用代码图信息的跨语言代码搜索方法,称为CCCS。该方法首先使用预训练的CodeBERT将代码片段转换为高维向量,以提取代码片段的序列特征;接着利用图卷积神经网络提取代码片段的结构特征;最后通过对比学习方法对模型进行训练,优化跨语言代码片段的向量表示,使模型能够区分具有相同功能的
来源:ACM Transactions on Asian and Low-Resource Language Information Processing
时间:2025-11-08
-
通过深度学习结合阿育吠陀文本,提升资源匮乏环境下的梵语-印地语翻译质量
摘要机器翻译(MT)领域对神经机器翻译(NMT)表现出浓厚的兴趣,因为NMT能够在广泛的输入和输出短语长度范围内持续处理数据。NMT系统采用了先进的注意力机制,能够专注于输入句子中的特定部分,而无需为每个输入句子获取整个向量。虽然这种神经方法通过解决长期依赖性问题并使上下文分析更加容易实现,从而提升了翻译质量,但它也需要一个足够的平行语料库来进行训练,而在资源有限的方言地区这颇具挑战性。本研究的主要目标是解决使用神经机器翻译(NMT)翻译阿育吠陀文本时所遇到的特殊难题。阿育吠陀文本由于其专业词汇和领域特定术语而具有独特的挑战性,因此需要采用定制化的方法来实现准确且有意义的翻译。为了构建一个可靠
来源:ACM Transactions on Asian and Low-Resource Language Information Processing
时间:2025-11-08
-
基于模糊化深度学习的医疗任务记录中签名伪造检测
摘要在数字化解决方案盛行的时代,手写签名在身份验证和文件认证中仍然发挥着至关重要的作用。作为一种生物特征验证方式,手写签名对每个人来说都是独一无二的,是确认身份和保障个人安全的基本手段。除了作为个人身份验证的工具外,签名还常常被视为关键文件和流程验证的基石,尤其是在医疗领域。在医疗行业中,特别是在欠发达地区,手写记录仍然是主要的文档记录方式。这些手写文件的可信度取决于其签名的真实性,因此签名验证成为保护医疗信息完整性和安全性的关键措施。然而,传统的离线签名识别方法往往耗时且效率低下,尤其是在处理大量文件时。这凸显了自动化签名验证系统的迫切需求。我们的研究提出了一种创新的签名验证系统,该系统结合
来源:ACM Transactions on Asian and Low-Resource Language Information Processing
时间:2025-11-08
-
UrduAspectNet:结合Transformer和双重GCN进行乌尔都语基于方面的情绪检测
摘要乌尔都语以其复杂的形态结构和语言细微差别而著称,在计算情感分析方面面临独特的挑战。为了解决这些问题,我们推出了“UrduAspectNet”——一个专为乌尔都语的基于方面的感情分析(ABSA)设计的模型。我们方法的核心是一个严格的预处理阶段。通过使用Stanza库,我们提取了词性(POS)标签和词元,确保乌尔都语的语言特性得到恰当的表示。为了探究不同嵌入方法的有效性,我们使用mBERT和XLM-R嵌入对模型进行了训练,并比较了它们的性能,以确定最适合乌尔都语ABSA的表示方法。考虑到乌尔都语灵活句法结构中词语之间的微妙关系,我们的模型融入了双图卷积网络(GCN)层。为了解决缺乏专用乌尔都语
来源:ACM Transactions on Asian and Low-Resource Language Information Processing
时间:2025-11-08
-
基于自然语言处理的机器学习在英语作文智能评分中的应用研究
摘要在当前数字化时代,知识管理对于教学和学习过程至关重要。“通过合作学习”的理念使得自然语言处理成为一种流行的工具,它基于智能系统来评估学生的写作内容,从而改进学习过程。英语学习在很大程度上依赖于学生在不同主题下撰写的作文。教师在批改学生作文时面临巨大困难,因为学生的写作水平因人而异。在这项研究中,利用自然语言处理技术对学生写作技能进行训练,并结合多处理器学习算法(MLA)和卷积神经网络(CNN)(MLA-CNN)来评估作文并给学生打分。该模型的作文评分率通过多种学习率设置进行了验证。本文提出了一些关于智能教学的理论观点,希望这种自动作文评分模型能够用于英语课堂中的学生作业评分。当应用于学校对
来源:ACM Transactions on Asian and Low-Resource Language Information Processing
时间:2025-11-08
-
MEAN:专家混合神经接收器——架构与性能分析
摘要基于神经网络的无线接收器,也称为“神经接收器”,在性能上优于传统接收器,但计算复杂度更高。在注重能源效率的边缘设备上使用这些网络的需求日益增加,因此需要开发出能够在不同信道条件下高效运行的自适应神经接收器。通过将静态神经接收器转换为基于动态神经网络(DyNN)概念的动态模型,可以降低运行时的计算复杂度和能耗。这种方法可以在运行时调整网络架构,并利用移动通信系统中的变化信道条件来减少计算复杂度。本文介绍了一种名为MEAN的新型神经接收器架构,该架构基于硬门控的专家混合(MOE)技术。MEAN的核心思想是在运行时使用多个较小的信噪比(SNR)专家网络,根据当前数据输入选择合适的专家网络以降低复
来源:ACM Transactions on Embedded Computing Systems
时间:2025-11-08
-
SIMD-CP:一种针对量化深度神经网络(Quantized DNNs)的SIMD技术,该技术结合了冗余位压缩(Redundant Bits Compression)和混合精度打包(Mixed-Precision Packing)机制
摘要在边缘设备上部署深度神经网络(DNN)面临诸多挑战,包括执行时间、功耗和内存占用问题。为了解决这些限制,基于软件的模型压缩技术与专用硬件的协同设计对于在边缘设备上高效部署DNN至关重要。然而,硬件需要支持多种模型压缩技术,而特定的压缩格式会对传统单指令多数据流(SIMD)架构的有效使用带来限制,例如低位宽精度、细粒度混合精度和稀疏矩阵。为了解决这些问题,我们提出了SIMD-CP,这是一种具有基于标签的精度检测和冗余位宽压缩功能的SIMD架构。具体来说,我们引入了两种新的SIMD指令:(i)带标签的向量加载指令(tvl),它从内存中获取量化向量,并附加位宽元数据作为标签;(ii)打包点积指令
来源:ACM Transactions on Embedded Computing Systems
时间:2025-11-08
-
基于形态句法信息的波斯语共指消解算法:结合自适应剪枝与全局上下文聚合技术
摘要在波斯语中,共指消解(coreference resolution)是自然语言理解(natural language understanding)任务中的关键环节。由于波斯语具有省略主语(pro-drop)的倾向、灵活的词序结构以及复杂的形态句法一致系统,这一任务面临着独特的挑战。本研究首次提出了一种端到端(end-to-end, e2e)的神经网络架构,用于全面处理波斯语中的共指现象,涵盖代词、名词和命名实体的指代关系。该系统基于ParsBERT模型,并创新性地整合了联合提及检测与类型分类(Joint Mention Detection and Type Classification,
来源:ACM Transactions on Asian and Low-Resource Language Information Processing
时间:2025-11-08
-
基于图的以对象为中心的学习方法:迈向具备物理感知能力的实体化控制
摘要理解物理学对于智能机器人和具身代理来说至关重要,它们需要借助物理学来感知世界、移动物体、安全地与环境互动,并优化运动和过程。在本文中,我们提出了GraphSlot,这是一个基于槽(slot)的对象中心学习框架,该框架利用图神经网络来模拟物体之间的交互。GraphSlot根据物体的空间位置以及重力的外部影响动态构建图结构。来自邻近物体的信息会被传播到相连的节点之间。通过对仿真数据集进行全面的实验,我们证明了GraphSlot的性能达到了业界领先水平,与基线模型SAVi-L相比,其在前景调整后的Rand指数(fg-ARI)上提升了8.5%。作为评估的一部分,我们设计了一个真实的接球游戏环境来测
来源:ACM Transactions on Cyber-Physical Systems
时间:2025-11-08
-
利用大型语言模型的共形时序逻辑规划
摘要本文探讨了移动机器人的时序逻辑任务规划问题。我们研究了需要按照特定的时间和逻辑顺序完成多个高级子任务的场景,这些子任务用自然语言(NL)表达。为了正式定义这些任务,我们将这些子任务视为线性时序逻辑(LTL)公式中的原子谓词,并将这种任务规范框架称为LTL-NL。我们的目标是设计出能够完成LTL-NL任务的机器人动作序列。由于原子谓词的自然语言特性,现有的LTL规划器无法直接解决这一动作规划问题。因此,我们提出了HERACLEs,这是一种分层神经符号规划器,它结合了以下三种技术:(i) 用于生成高级任务规划的现有符号规划器,这些规划器决定了子任务的执行顺序;(ii) 预训练的大型语言模型(L
来源:ACM Transactions on Cyber-Physical Systems
时间:2025-11-08
-
NeutronAscend:利用Ascend AI处理器优化图神经网络(GNN)训练
摘要图神经网络(GNN)在图数据分析领域取得了显著的成功。然而,其应用需要大量的计算资源。最近,新一代的神经处理单元(NPUs),如Ascend AI处理器,由于其出色的性能和较低的采购门槛,已成为数据中心和技术公司计算能力的重要组成部分。在这些加速器上部署GNN模型以优化性能是一个自然的选择;然而,这仍然是一项具有挑战性的任务。Ascend AI处理器通常由多个物理上解耦的AI核心组成,这些核心专为密集矩阵计算而设计。在处理具有固有稀疏性和幂律分布的图数据时,Ascend AI处理器会面临核心间工作负载不平衡以及核心内资源利用效率低的问题。在本文中,我们提出了NeutronAscend,这是
来源:ACM Transactions on Architecture and Code Optimization
时间:2025-11-08
-
PDGNN:通过度数剪枝划分和冗余消除实现高效的微批量图神经网络训练
摘要图神经网络(GNNs)在基于图的应用中变得至关重要。现有的GNN训练框架主要采用基于采样的小批量方法,通过采样顶点邻域来迭代构建子图进行训练,但这种方法存在内存与准确率之间的权衡。为了解决这个问题,可以应用简单的微批量训练并累积梯度,但这会导致由于重复采样邻居而产生的严重冗余。最近的微批量训练方法通过采用批量级图划分策略来克服这一问题,这些策略将从所有目标顶点采样的全批量子图进行划分以生成微批量。然而,这些方法在平衡划分开销和冗余方面仍然存在困难。本文提出了PDGNN,这是一种专为单台机器上的高效微批量GNN训练设计的系统,能够减少训练时间和内存消耗。首先,我们提出了一种基于度数剪枝的图划
来源:ACM Transactions on Architecture and Code Optimization
时间:2025-11-08
-
带有子图解耦措施的图学习撤销系统
摘要图去学习系统为安全地从图神经网络(GNNs)中删除特定数据点及其相关影响提供了一种有前景的解决方案。然而,现有方法通常通过将图数据划分为孤立的子图来将问题视为多个相互独立的子问题,这忽略了子图之间的固有图结构信息。这导致了有偏的表示,阻碍了对数据中关键连接和关系的准确建模,从而由于信息丢失而显著降低了模型的实用性。为了解决这些问题,我们提出了一个名为NIGEraser的创新框架(Non-Isolated Graph Eraser),该框架将去学习任务分解为多个非孤立的、相互交叉的子问题。具体而言,NIGEraser提出了一种新的非孤立图划分策略,通过在多个相邻子图中复制关键节点来减轻隔离现
来源:ACM Transactions on Autonomous and Adaptive Systems
时间:2025-11-08
-
使用保留符号的托普利茨滤波器和考虑输入激活密度的数据流来压缩和加速稀疏卷积神经网络(Sparse CNNs)
摘要利用卷积神经网络中的稀疏性对于加速计算和降低能耗至关重要。非结构化稀疏性因其能够适应任意稀疏模式而具有灵活性,通常能够实现更高的准确率,但它往往会引入卷积操作中的不规则性,从而复杂化控制逻辑并削弱稀疏化的优势。结构化稀疏性虽然可以缓解这些问题,但却牺牲了其应用灵活性,导致准确率下降。在本文中,我们提出了TSCNN,这是一种算法-硬件协同设计的解决方案,旨在压缩和加速稀疏卷积神经网络(CNN),同时平衡其对稀疏性的适应性和计算效率。在算法方面,TSCNN采用经过剪枝的滤波器,并采用保留符号的托普利茨矩阵格式(Tfilters)进行压缩,这系统地增强了数据重用的规律性,并通过44%-86%的方
来源:ACM Transactions on Architecture and Code Optimization
时间:2025-11-08
-
基于自主图像的扫描流程,用于文化遗产领域中透明物体的三维数字化,该方法利用场景表示技术
摘要3D重建在多个领域都至关重要,例如文化遗产数字化、医学以及工业中的损伤评估、机器人交互和精确文档记录。然而,由于光线折射的影响,传统基于图像的方法(如多视图立体成像)在重建透明物体时面临挑战,这限制了基于特征的技术的应用。为了解决这些问题,本文提出了一种自主扫描流程,通过精确的手眼校准机制在图像采集过程中直接获取相机姿态信息,从而实现对透明物体的准确数字化。该方法能够生成清晰的神经表面模型和高斯斑点重建结果,并实现隐式几何结构的估计。本文研究了在不同光照条件下的输入数据集,并采用了多种3D重建方法来评估透明3D打印物体和复古酒杯。实验表明,所提出的扫描流程结合最佳光照条件,无需专门的神经表
来源:Journal on Computing and Cultural Heritage
时间:2025-11-08
-
适用于资源受限环境的节能型概率贝叶斯神经网络
摘要在信息物理系统领域,计算元素与物理元素之间的紧密集成至关重要,因此对高效且可扩展的机器学习模型的需求始终存在。贝叶斯神经网络(BNN)为解决这类系统中的复杂任务提供了有前景的途径,但其广泛应用受到计算复杂性和资源限制的阻碍。为应对这些挑战,我们提出了一种基于FPGA实现的概率贝叶斯神经网络(ProbBNN),该架构利用概率计算原理来简化BNN中的推理过程。在ProbBNN中,每个神经元的参数不再表示为具有均值和方差的随机变量,而是由概率密度函数(PDF)来表示,该函数描述了这些随机变量的分布。遵循PDF的随机流通过概率计算原理在网络中传播不确定性。采用概率计算消除了对昂贵的乘累加(MAC)
来源:ACM Journal on Emerging Technologies in Computing Systems
时间:2025-11-08
-
ChaoticImmuneNet:一种受混沌现象驱动的免疫机制启发的神经网络范式,适用于资源受限设备中的体感智能应用
摘要边缘设备(Edge Devices, ED)在实现智能网络物理系统(Smart Cyber-Physical Systems, CPS)的智能决策能力方面发挥着关键作用。然而,鉴于边缘设备的资源限制,这一目标颇具挑战性。预先训练好的机器学习模型在处理通过边缘设备提供的真实世界数据时表现不佳。传统的具身人工智能(Embodied Artificial Intelligence, AI)策略将训练任务外包出去以适应真实世界数据,但这种对外部资源的依赖带来了延迟、隐私、可扩展性等问题,这些问题对CPS的运行不利。作为解决方案,本文提出了一种轻量级的具身AI方法——ChaoticImmuneNet
来源:ACM Journal on Emerging Technologies in Computing Systems
时间:2025-11-08
-
用于智能合约的自动化漏洞检测框架
摘要随着区块链技术在提供去中心化解决方案方面的应用日益广泛,智能合约变得越来越流行,目前每天通过这种技术交易的金额已达数十亿美元。与此同时,攻击者利用智能合约中的各种漏洞窃取了价值数百万美元的加密货币。因此,自动检测智能合约漏洞是一个重要的研究课题。现有的解决方案主要依赖人类专家来定义特征或规则来识别漏洞,但这往往导致许多漏洞被忽略,并且在检测新漏洞方面效率低下。为了解决这些问题,我们提出了一个框架,用于自动检测区块链上的智能合约漏洞。具体而言,首先我们利用从智能合约字节码中提取的新颖特征向量(因为智能合约的源代码很少公开可用)。然后,我们使用基于度量学习的深度神经网络(DNN)对这些特征向量
来源:Distributed Ledger Technologies: Research and Practice
时间:2025-11-08
-
程序的深度学习表示方法:一项系统性的文献综述
摘要在当代,深度学习(DL)越来越多地被认为是一种有前景的方法,可以用于实现和优化各种技术,尤其是在代码(软件程序)领域。本质上,深度学习主要是一种表示学习方法,这在代码领域尤为适用。因此,代码深度学习的核心是对程序进行深度表示学习。学习到的程序表示可以应用于各种与编码相关的任务,例如检测漏洞、提供API使用建议以及从大量代码行中提取语义和语法信息。这是通过利用深度神经网络架构和深度学习算法来实现的,这些算法将程序作为输入,服务于各种软件工程应用。在本文中,我们进行了系统的文献检索,以回顾利用深度学习方法对程序进行表示的相关研究及其应用。我们的检索发现了2017年至2023年间发表的178篇主
来源:ACM Computing Surveys
时间:2025-11-08