da4ml:用于FPGA上实时神经网络的分布式算术
《ACM Transactions on Reconfigurable Technology and Systems》:da4ml: Distributed Arithmetic for Real-time Neural Networks on FPGAs
【字体:
大
中
小
】
时间:2025年11月18日
来源:ACM Transactions on Reconfigurable Technology and Systems
编辑推荐:
提出一种基于分布式算术的CMVM高效算法,用于FPGA上的低延迟神经网络部署,在减少30%面积消耗的同时显著提升计算速度,并已集成至开源库hls4ml,实现高量化网络的高效应用。
摘要
像在欧洲核子研究中心(CERN)的大型强子对撞机中使用的那样,需要微秒级延迟时间的神经网络通常会以完全展开和流水线化的方式部署在FPGA上。这类神经网络部署的一个瓶颈是面积利用率,这直接与所需的矩阵-向量乘法(CMVM)操作有关。在这项工作中,我们提出了一种高效的算法,用于在FPGA上实现CMVM操作,同时优化面积消耗和延迟。该算法在计算速度上显著优于现有最先进算法的同时,也能实现资源的高效利用。所提出的算法是开源的,并已集成到hls4ml库中,这是一个用于在FPGA上运行实时神经网络推理的免费开源库。我们证明,对于实际应用中高度量化的神经网络,该算法可以将芯片上的资源使用量减少多达三分之一,同时还能降低延迟,从而实现以前无法实现的神经网络架构。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号