8 位态二维浮栅存储器:大规模卷积神经网络的高效硬件之选

《Nature Communications》:

【字体: 时间:2025年03月19日 来源:Nature Communications

编辑推荐:

  人工智能发展促使对高效神经形态计算硬件(NCH)需求激增,二维浮栅存储器(2D FGMs)虽有潜力,但存在局限。研究人员设计了基于栅注入模式(GIM)的 2D FGMs。实现 8 位态,相关实验与模拟匹配良好,验证了其用于高性能 NCH 的潜力。

  在当今科技飞速发展的时代,人工智能(AI)如同一位神奇的魔法师,渗透到了我们生活的方方面面,从自动驾驶汽车在复杂路况下的精准导航,到天气预报借助海量数据预测天气变化,再到语音识别让我们能与智能设备轻松对话,还有图像理解助力医疗影像诊断等。AI 的核心技术 —— 基于神经网络(NNs)的机器学习,展现出了令人惊叹的能力。然而,这背后却隐藏着一个棘手的问题。
传统的冯?诺依曼架构中,物理上分离的存储器和逻辑单元之间的数据来回传输,以及数字数据处理模式,极大地限制了系统效率。就好比在一场接力比赛中,接力棒在不同选手之间传递时,总是出现卡顿和延误,导致整个比赛的节奏被打乱。这使得人们对高效的神经形态计算硬件(NCH)的需求愈发迫切,尤其是对于那些能够在本地以类似人脑的模拟方式处理和存储数据的智能边缘设备。
在算法层面,NNs 处理权重时需要无限精度,可这对于 NCH 来说是难以实现的。理论研究表明,许多 8 - 24 位精度的深度 NNs 与更高精度相比,几乎不会出现精度下降的情况,但精度过低(如小于 8 位)又会导致性能下降,特别是对于部署在边缘设备上的小型 NNs。这就像是搭建一座积木城堡,每一块积木(参数)都至关重要,精度不够就会让城堡变得摇摇欲坠。所以,能够支持多种可区分电导水平的设备成为了实现高效 NCH 的关键。
非易失性存储器,如浮栅存储器(FGMs)、电阻式开关存储器、相变存储器和铁电存储器等,都成为了 NCH 的候选者。其中,FGMs 因其基于非易失性电荷的模拟存储模式、与视觉和听觉信号匹配的学习率、大动态范围以及与标准互补金属氧化物半导体(CMOS)技术的兼容性而备受关注。特别是将 FGMs 与新兴的二维(2D)材料结合形成的 2D FGMs,更是被寄予厚望,有望实现高度集成的 NCH。但 2D 材料对界面态的高敏感性以及电介质与缺陷相关的不稳定性,导致 2D FGMs 存在长期稳定性差、耐久性不佳和存储状态少等问题,就像美丽的花朵容易遭受病虫害的侵袭,难以茁壮成长。
为了解决这些问题,中国科学院纳米系统与分级制造重点实验室、中国科学院大学材料科学与光电工程中心等机构的研究人员展开了深入研究。他们设计了工作在栅注入模式(GIM)下的二维浮栅存储器,将其作为大规模 NCH 的潜在设备单元。这项研究成果发表在了《Nature Communications》上。
研究人员在实验中采用了多种关键技术方法。在器件制备方面,他们在 p 掺杂的硅衬底上依次进行多步操作,包括涂覆光刻胶、图案化和沉积不同材料等。对于阵列制备,先将化学气相沉积(CVD)生长的 MoS2转移到特定衬底上,再进行后续处理。电子测量则分别在不同的测试平台上进行,以获取器件和阵列的电学性能数据。此外,还利用 Keras 平台加载预训练的大规模卷积神经网络(CNNs)模型,并通过 Python 脚本进行相关操作和评估。

8 位精度编程的 GIM 2D FGMs

研究人员设计了具有特定结构的 GIM 2D FGMs,采用单层 / 少层 MoS2、5nm 的 Pt 和 8nm 的 Al2O3分别作为通道、浮栅和隧穿 / 阻挡层。共面设计使控制栅(CG)、浮栅和通道解耦,通过改变 CG 与通道的面积比来调节栅编程电压。采用双脉冲状态编程策略,解决了电荷注入 / 擦除过程中不稳定捕获电荷导致的问题。通过这种方法,GIM 2D FGMs 可实现高达 256 个可区分状态,相当于 8 位精度,相邻状态间变化超过 3 倍标准差,编程电压可低至 3V。

可编程性和可靠性

研究人员通过特定的器件电路配置研究 GIM 2D FGMs 的可编程性。发现编程效率与等效横向配置电容的耦合比相关,即与栅面积比有关。通过改变栅面积,可在保持大记忆窗口的同时降低编程电压。该器件在 10000 秒以上能保持稳定的编程状态,具有高达 1×108的开 / 关比,耐久性可达 105次循环,展现出良好的可靠性。

8 位编程能力的可重复性

研究人员制备了 256 个器件,研究 8 位编程能力的可重复性。结果显示,器件的良品率为 94.9%,120 个器件编程到 256 个不同状态的成品率为 87.6%,编程状态的器件间变化低于 4%,表明该器件具有良好的可重复性。

基于器件阵列的硬件卷积

研究人员制备了 9×2 的阵列进行硬件卷积。将图像像素转换为电压输入阵列,输出电流作为卷积结果。实验结果与软件卷积结果匹配良好,并且能够将大规模卷积神经网络 VGG16 第一块中的 38592 个卷积核参数映射到阵列上,展示了其硬件集成能力。

8 位精度的卷积神经网络

研究人员使用预训练的大规模 CNNs 进行 ImageNet 数据集识别,将参数量化为 GIM 2D FGM 的 8 位状态。结果表明,8 位精度足以使 CNNs 实现较高的识别准确率。无论是训练后量化还是训练中量化,8 位精度都具有优势,并且随机舍入方案可提高固定精度下的准确率。
研究人员成功设计了工作在栅注入模式下的二维浮栅存储器,通过独特的结构设计和编程策略,实现了 8 位电导状态。这些状态具有高度可区分性和稳定性,器件还具备良好的耐久性、可重复性和低编程电压等优点。基于该器件的阵列进行的硬件卷积实验结果与软件模拟匹配良好,并且在 8 位精度的卷积神经网络中展现出较高的识别准确率。这项研究为高性能神经形态计算加速器的发展提供了新的方向,验证了 GIM 2D FGMs 在高效神经形态计算硬件中的巨大潜力,有望推动人工智能硬件领域的进一步发展,让智能设备更加高效、智能地服务于人们的生活。

涓嬭浇瀹夋嵎浼︾數瀛愪功銆婇€氳繃缁嗚優浠h阿鎻ず鏂扮殑鑽墿闈剁偣銆嬫帰绱㈠浣曢€氳繃浠h阿鍒嗘瀽淇冭繘鎮ㄧ殑鑽墿鍙戠幇鐮旂┒

10x Genomics鏂板搧Visium HD 寮€鍚崟缁嗚優鍒嗚鲸鐜囩殑鍏ㄨ浆褰曠粍绌洪棿鍒嗘瀽锛�

娆㈣繋涓嬭浇Twist銆婁笉鏂彉鍖栫殑CRISPR绛涢€夋牸灞€銆嬬數瀛愪功

鍗曠粏鑳炴祴搴忓叆闂ㄥぇ璁插爞 - 娣卞叆浜嗚В浠庣涓€涓崟缁嗚優瀹為獙璁捐鍒版暟鎹川鎺т笌鍙鍖栬В鏋�

涓嬭浇銆婄粏鑳炲唴铔嬬櫧璐ㄤ簰浣滃垎鏋愭柟娉曠數瀛愪功銆�

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号