
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:用于内存计算中的模型量化技术:综述
《Science China-Information Sciences》:Model quantization for computing-in-memory: a survey
【字体: 大 中 小 】 时间:2025年11月09日 来源:Science China-Information Sciences 7.6
编辑推荐:
DNNs部署在资源受限平台面临参数和计算挑战,CIM通过计算与内存整合解决冯·诺依曼瓶颈,但受限于设备精度,模型量化成为关键。本文系统综述CIM加速器量化方法,分析固定精度、混合精度优化及量化模型优化,探讨当前挑战与未来方向。
深度神经网络(DNN)在各种应用中表现出卓越的性能。尽管它们具有高精度,但庞大的参数量和复杂的计算过程给资源受限平台上的部署带来了巨大挑战。计算内存(CIM)通过整合计算单元和存储单元,成为一种有前景的解决方案,从而克服了传统的冯·诺依曼瓶颈,提高了整体效率。然而,由于设备表示和数据接口精度的固有限制,CIM系统难以支持高精度计算。因此,模型量化成为在这些平台上部署DNN的关键技术。本文对基于CIM的加速器的模型量化方法进行了全面综述。首先,我们介绍了模型量化和CIM的基本概念。然后,我们从三个角度回顾和分析了现有研究:固定精度量化、混合精度量化以及量化模型的优化。最后,我们讨论了当前CIM特定量化领域面临的挑战和未来的发展方向。
深度神经网络(DNN)在各种应用中表现出卓越的性能。尽管它们具有高精度,但庞大的参数量和复杂的计算过程给资源受限平台上的部署带来了巨大挑战。计算内存(CIM)通过整合计算单元和存储单元,成为一种有前景的解决方案,从而克服了传统的冯·诺依曼瓶颈,提高了整体效率。然而,由于设备表示和数据接口精度的固有限制,CIM系统难以支持高精度计算。因此,模型量化成为在这些平台上部署DNN的关键技术。本文对基于CIM的加速器的模型量化方法进行了全面综述。首先,我们介绍了模型量化和CIM的基本概念。然后,我们从三个角度回顾和分析了现有研究:固定精度量化、混合精度量化以及量化模型的优化。最后,我们讨论了当前CIM特定量化领域面临的挑战和未来的发展方向。