基于LUTNet储层计算的340微瓦超低功耗TinyML系统在低成本FPGA上的实现

《IEEE Embedded Systems Letters》:A 340- μ W TinyML Using LUT-Based Reservoir Computing on Low-Cost FPGAs

【字体: 时间:2025年11月28日 来源:IEEE Embedded Systems Letters 2

编辑推荐:

  本刊推荐一项突破性研究:为解决边缘设备在严格功耗约束(<340μW)下实现长期连续运行的难题,研究人员开展了基于查找表网络的储层计算(LUTNet-RC)在iCE40系列FPGA上实现的TinyML研究。该系统在人体活动识别(HAR)、癫痫检测(ED)和心电信号分析(ECG)任务中分别达到93.1%、98.6%和92.7%的准确率,功耗仅254-335μW,可实现LR6电池持续供电一年运行,相比传统方案能效提升10-1000倍,为医疗健康和异常检测领域的边缘计算提供了创新解决方案。

  
随着物联网(IoT)设备和可穿戴传感器的普及,边缘机器学习(TinyML)的需求急剧增长。在医疗健康和异常检测等领域,这些嵌入式设备需要满足极其严格的功耗约束——系统总功耗必须低于340μW,才能在标准LR6电池(3000mWh)上实现连续一年以上的运行。然而,传统基于微控制器单元(MCU)和现场可编程门阵列(FPGA)的储层计算(RC)实现方案通常需要数毫瓦到数十毫瓦的功耗,难以满足这一严苛要求。此外,低成本制造也是嵌入式设备中TinyML部署的关键挑战。如何在保证性能的同时,兼顾低制造成本和严格功耗约束,成为当前研究的重点难点。
储层计算(RC)作为一种低训练成本、高精度的循环神经网络(RNN)变体,因其在实时数据处理方面的优势而备受关注。但现有RC实施方案的功耗水平仍远高于TinyML的应用需求。针对这一瓶颈,九州工业大学的研究团队在《IEEE Embedded Systems Letters》上发表了一项创新研究,提出了一种基于查找表网络的储层计算(LUTNet-RC)系统,通过结合专为FPGA实现的LUTNet量化方法和iCE40系列低成本FPGA,成功将系统功耗控制在340μW以下。
技术方法方面,研究团队主要采用三个关键技术:首先,基于查找表网络(LUTNet)的储层层设计,将神经元输入-输出关系直接映射到FPGA的LUT元件,使储层层计算在单时钟周期内完成;其次,选用静态功耗仅数十微瓦级的iCE40系列FPGA作为硬件平台;第三,采用简单时分计算(Simple-TDC)方案实现输出层,通过单个乘积累加(MAC)单元时分复用降低电路规模。实验使用来自公开数据集的人体活动识别(HAR)、癫痫检测(ED)和心电信号(ECG)信号数据,采样率分别为50Hz、16Hz和250Hz。
研究结果方面,通过系统架构设计与性能评估、实际应用验证以及与传统方案的对比分析,得出以下结论:
系统架构设计与性能评估
研究人员设计了专为iCE40 FPGA优化的LUTNet-RC系统架构,利用FPGA内置的I2C硬核作为数据接口单元。在iCE40 UP5K上的布局布线结果表明,当储层神经元数Nr=256和512时,分别占用68.7%和94.4%的LUT资源,且最大运行频率均可达33MHz。功耗测试显示,在满足340μW约束的条件下,Nr=256的系统可在188kHz频率下实现732样本/秒(sps)的吞吐量,而Nr=512的系统在136kHz频率下达到265sps吞吐量。
实际应用验证
在三个典型TinyML应用中的测试结果表明,LUTNet-RC在HAR、ED和ECG任务中分别达到93.1%、98.6%和92.7%的准确率,平均准确率94.8%,优于回声状态网络(ESN)、混沌玻尔兹曼机RC(CBM-RC)等传统RC模型,以及RNN和门控循环单元(GRU)等深度学习RNN模型。功耗分析显示,各应用所需运行频率仅为4-128kHz,动态功耗低至1.88-83.13μW,静态功耗稳定在252.10μW。
与传统方案对比
与先前基于Artix-7 FPGA和Cortex A53 MCU的方案相比,本研究的功耗效率提升10-1000倍。特别是在相同iCE40 UP5K平台上,传统方案功耗达数毫瓦,而LUTNet-RC通过低运行频率实现功耗的大幅降低。当需要更高性能时,系统最高可在33MHz频率下运行,实现128,405sps(Nr=256)和64,327sps(Nr=512)的吞吐量。
研究结论表明,基于iCE40 UP5K的LUTNet-RC系统成功实现了超低功耗(<340μW)和低成本的TinyML解决方案。该系统在保持高精度的同时,显著降低了功耗,使电池供电的嵌入式设备能够实现长期连续运行。通过LUTNet量化方法和低成本FPGA的有机结合,研究为医疗健康监测和工业异常检测等领域的边缘计算应用提供了新的技术路径,展示了LUTNet-RC在满足严格功耗约束下的实用性和优越性。未来可通过引入储层层时分计算和连接超参数调整,进一步扩展系统处理能力。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号