基于RFSoC的流式CNN调制分类技术:数据集生成与量化感知训练研究
《IEEE Open Journal of Circuits and Systems》:RFSoC Modulation Classification With Streaming CNN: Data Set Generation & Quantized-Aware Training
【字体:
大
中
小
】
时间:2025年11月13日
来源:IEEE Open Journal of Circuits and Systems 2.4
编辑推荐:
本文针对无线通信物理层(PHY)实时调制分类需求,提出了一种基于RFSoC的流式卷积神经网络(CNN)架构。研究人员通过将RFSoC纳入数据生成回路创建专用数据集,采用量化感知训练开发了16位、8位和4位三种权重精度的分类模型。实验表明16位模型在RFSoC2x2开发板上实现了76%的分类准确率,且资源占用最优。该研究为深度学习在边缘设备上的实时部署提供了重要技术参考,推动了AI在6G通信系统中的实际应用。
随着5G技术的普及和6G时代的到来,无线通信系统面临着前所未有的技术挑战。在物理层(PHY)通信中,传统人工设计的算法已难以应对高移动性环境下的信道估计、可持续认知无线电等复杂场景。深度学习(DL)作为一种新兴技术手段,在无线通信领域展现出巨大潜力,然而如何将理论模型有效部署到实际硬件平台成为制约其应用的关键瓶颈。
现有研究虽在调制分类任务上取得了一定进展,但多数工作仍停留在仿真阶段或使用预录制数据。更关键的是,传统神经网络架构难以满足无线通信系统对数据流连续处理和无样本丢失的严苛要求。射频系统级芯片(RFSoC)作为集成了高速模数转换器(ADC)和可编程逻辑的先进平台,为深度学习算法的硬件部署提供了理想载体,但如何实现模型与硬件的高效协同仍是一个待解决的难题。
在这项发表于《IEEE Open Journal of Circuits and Systems》的研究中,英国思克莱德大学StrathSDR研究团队的Andrew Maclellan等人提出了一种创新的解决方案。他们针对AMD RFSoC2x2开发平台,设计了一套完整的流式CNN架构,实现了对无线电数据的实时连续处理。该研究的独特之处在于将硬件特性纳入整个设计流程,从数据生成到模型部署形成闭环,为深度学习在无线通信系统中的实际应用提供了重要参考。
关键技术方法主要包括:通过RFSoC硬件回路生成包含实际信道效应的DeepRFSoC数据集;使用Brevitas框架进行量化感知训练,生成16位、8位和4位三种权重精度的调制分类模型;基于GEMM(通用矩阵乘法)优化的流式CNN架构,确保在128MHz采样率下实现无间断样本处理;利用PYNQ框架构建硬件测试平台,实现实时分类可视化。
研究人员设计的流式CNN架构核心创新在于其数据流处理机制。该架构将传统无线通信管道的数据流模型与深度学习推理相结合,确保每个样本都能被连续处理而不中断。系统采用分级处理策略:输入数据首先经过32倍降采样处理,将采样率从128MHz降至4MHz,随后通过乒乓缓冲机制将I/Q样本交织成一维数据流。卷积层通过GEMM变换将滑动窗口操作转化为矩阵运算,大幅提升计算效率。特别值得关注的是,该设计通过提高时钟频率和并行化MAC(乘加器)单元,成功解决了卷积操作中的样本冗余问题。
研究团队摒弃了常用的RadioML数据集,创新性地将RFSoC硬件纳入数据生成环节。DeepRFSoC数据集的创建过程充分考虑了实际部署环境中的信号劣化因素,包括非理想滤波器响应、ADC量化效应以及交织ADC拼接伪影等。数据集涵盖八种调制方案(QPSK、BPSK、QAM16、QAM64、8PSK、PAM4、GFSK和CPFSK),在-20dB至30dB信噪比(SNR)范围内包含260万帧数据。量化感知训练结果表明,16位权重模型在高温噪声环境下仍保持最佳性能,其准确率显著高于低精度模型。
在AMD XCZU28DR RFSoC芯片上的实现结果表明,16位模型仅占用10%的DSP切片和15%的BRAM资源,展现了优异的资源效率。实时测试环节通过PYNQ框架构建的交互式Jupyter应用进行,能够同时对比三种量化模型的性能。测试数据显示,16位权重模型在SNR>20dB时达到76%的平均分类准确率,较8位和4位模型分别高出6%和13%。值得注意的是,该模型在处理真实射频信号时表现与仿真测试高度一致,验证了其实际部署的可靠性。
与现有CNN加速器相比,该研究的最大优势在于实现了真正的实时射频信号分类。如表4所示,虽然该设计的吞吐量(34k CPS)低于部分对比方案,但其在真实信道条件下的表现更具参考价值。特别值得关注的是,该架构保持了与原始O'Shea模型相同的网络维度,证明无需通过增加网络复杂度来补偿量化带来的精度损失。
研究结论强调,16位量化模型在准确率和资源消耗间取得了最佳平衡,是RFSoC接收器部署调制分类器的理想选择。该工作不仅为调制分类任务提供了实用解决方案,更重要的是建立了一套将深度学习模型从理论推向实际部署的完整方法论。其流式处理架构为后续研究提供了重要借鉴,特别是在信道估计、信号解码等对时序要求严格的无线通信应用场景中具有广阔前景。
这项研究的成功实践表明,通过硬件感知的算法设计和系统级优化,深度学习模型完全能够在资源受限的边缘设备上实现高效部署。随着6G技术标准的逐步明确,这种硬件与算法协同设计的方法论将为未来智能无线通信系统的发展提供重要技术支撑。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号