
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于HLS编译PYNQ平台的心律失常量化ECG图像检测系统:并行化CNN架构与硬件优化
【字体: 大 中 小 】 时间:2025年05月23日 来源:Biomedical Signal Processing and Control 4.9
编辑推荐:
本研究针对FPGA(现场可编程门阵列)部署深度学习模型时存在的内存访问瓶颈和计算延迟问题,提出了一种基于高位合成(HLS)的并行双分支卷积神经网络(PQP-CNN),通过量化ECG心拍图像至4比特(UINT4)、设计跳零权重(SZW)架构和融合加池单元,在PYNQ-Z2开发板上实现97.79%分类准确率(基于MIT-BIH数据集),为便携式医疗设备提供236ms低延迟解决方案。
心脏疾病是全球主要死亡原因之一,而心律失常的早期诊断对挽救生命至关重要。传统心电图(ECG)分析依赖医生经验,深度学习虽能提升诊断精度,但复杂的卷积神经网络(DCNN)在资源有限的便携设备上部署时,就像试图把大象塞进冰箱——面临内存占用大、计算延迟高、功耗惊人三大难题。更棘手的是,医疗场景对模型准确性和实时性有着近乎苛刻的双重要求,现有FPGA实现方案要么牺牲精度采用1D-CNN,要么陷入量化误差与资源消耗的恶性循环。
针对这一系列挑战,研究人员开发了一套革命性的解决方案:基于AMD-Xilinx高位合成(HLS)工具链,在PYNQ-Z2开发板上构建了首个支持4比特量化ECG心拍图像的并行双分支CNN架构。这项研究巧妙融合了硬件优化与算法创新,通过三项核心技术突破:1)并行量化像素卷积(PQP-Conv)模块,将滤波器点乘操作并行化;2)跳零权重(SZW)单元,智能跳过零值权重计算;3)加法-池化融合单元,减少50%内存访问。最终在仅占用31.93%查找表(LUT)资源的情况下,实现了63 GOPS的惊人吞吐量。
关键技术方法包括:采用MIT-BIH心律失常数据库(AAMI EC57标准)的64×64灰度心拍图像;设计双分支2D-CNN架构(细粒度局部特征+全局上下文特征);使用Vitis HLS 2022.2进行C++硬件建模;实施层间动态量化策略保持UINT4精度;通过Vivado工具评估资源占用与时序性能。
【Related works】
现有研究多采用结构化剪枝或8比特量化压缩模型,但会引发精度失衡问题。相比Verilog HDL实现的1D-CNN方案,本研究首次实现2D-CNN在FPGA上的高效部署,且无需牺牲关键权重。
【Methodology】
创新性地将标准卷积与PQP-Conv分层应用:前两层处理原始量化图像,后续层启用并行卷积。通过消除ReLU激活函数,利用UINT4的非负特性简化计算,DSP单元占用控制在50.45%。
【Experimental results】
硬件测试显示:对N/S/V/F/Q五类心拍的分类准确率达97.79%,较同类FPGA方案提升6.2%;功耗降低至2.3W;BRAM占用仅30%,证明4比特量化的有效性。
【Conclusion】
该研究开创性地将医疗AI推理加速器开发周期从数月缩短至数周,其HLS-C++协同设计范式为边缘计算医疗设备树立了新标杆。特别值得注意的是,SZW架构使零权重过滤效率提升40%,这对未来超声、EEG等生物信号处理器的开发具有普适意义。PYNQ框架的Python接口设计,更使得该设备可直接应用于基层医疗机构,有望改变偏远地区心脏监护资源匮乏的现状。
生物通微信公众号
知名企业招聘