基于 RISC-V 扩展技术的无线基带无限向量处理

《IEEE Transactions on Very Large Scale Integration (VLSI) Systems》:Unlimited Vector Processing for Wireless Baseband Based on RISC-V Extension

【字体: 时间:2025年12月01日 来源:IEEE Transactions on Very Large Scale Integration (VLSI) Systems 3.1

编辑推荐:

  无线基带处理中,基于RISC-V的UVP指令集扩展通过非2的幂次寄存器组和硬件strip mining优化,解决了传统向量架构的长度限制和软件strip-mining负担问题,支持对称/非对称向量运算与专用加载存储策略,硬件实现采用高级 hazard检测和流水线优化,在矩阵乘法和FFT任务中实现3.0倍和2.1倍性能提升,16-lane配置下面积效率达21.2 GOPS/mm2。

  

摘要:

无线基带处理(WBP)是使用向量处理的理想场景,因为其并行结构在处理数据并行操作方面表现出色。然而,传统的向量架构存在一些限制,例如向量寄存器大小有限、依赖于2的幂次方作为向量长度(VL),以及向量排列能力受特定架构限制。为了解决这些问题,我们基于RISC-V引入了一种称为“无限向量处理”(UVP)的指令集扩展(ISE)。该扩展提高了向量计算的灵活性和效率。UVP采用了一种新的编程模型,支持非2的幂次方寄存器分组(RGs)和硬件条带挖掘技术,从而能够顺利处理不同长度的向量,同时减轻软件条带挖掘的负担。向量指令被分为对称类和不对称类,并配备了专门的加载/存储策略以优化执行。此外,我们还展示了UVP的硬件实现,其中包含复杂的危险检测机制、针对对称任务(如定点乘法和除法)的优化流水线,以及用于高效执行不对称操作的强大排列引擎。全面评估表明,与基于通道的向量架构相比,UVP在矩阵乘法和快速傅里叶变换(FFT)任务中分别实现了高达3.02.1的性能提升。我们使用SMIC 40纳米技术为16通道配置合成的寄存器传输级(RTL)设计占地面积为0.94平方毫米,面积效率达到21.2 GOPS/mm2。

引言

几十年来,向量处理一直是高性能计算的基石,为高效处理数据并行任务提供了专门的方法。通过采用单指令多数据(SIMD)技术,向量处理在科学计算[1]、图像处理[2]和机器学习[3]等应用中显著提升了性能。这些优势得益于向量处理器利用向量寄存器并行执行数据数组上的操作。这种范式利用数据级并行性(DLP)来实现比标量处理更高的吞吐量。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号