基于RRAM存内计算概率计算机的分子对接硬件实现及其在抗生素靶点发现中的应用

《Nature Communications》:A hardware demonstration of a universal programmable RRAM-based probabilistic computer for molecular docking

【字体: 时间:2025年12月11日 来源:Nature Communications 15.7

编辑推荐:

  为解决分子对接这一药物发现中的关键计算难题,研究人员开发了一种基于电阻随机存取存储器(RRAM)的通用可编程概率计算机(p-computer)。该硬件系统通过高斯随机数发生器(GRNG)驱动的人工概率比特(p-bit)实现存内计算(CIM),成功解决了脂蛋白与LolA-LolCDE复合物(革兰氏阴性菌抗生素靶点)的42节点最大权重团问题(MWCP),实验成功率高达72%。这项研究首次将概率计算硬件应用于计算生物学领域,为复杂生物信息学问题提供了高效解决方案。

  
在药物研发领域,分子对接犹如一把精准的钥匙,帮助科学家寻找能够与靶点蛋白完美结合的潜在药物分子。然而,生物分子结构的多样性和结合构象的灵活性产生了巨大的搜索空间,使得传统计算方法面临严峻挑战。虽然量子计算展现出潜力,但其可扩展性、硬件限制和精度问题仍然制约着实际应用。面对这一困境,新加坡国立大学和台湾阳明交通大学的研究团队另辟蹊径,在《Nature Communications》上发表了一项创新研究,他们开发出一种基于电阻随机存取存储器(RRAM)的概率计算机(p-computer),专门用于解决复杂的分子对接问题。
这项研究的核心目标是解决传统计算方法在分子对接中遇到的效率瓶颈。分子对接需要评估配体与受体之间无数可能的结合方式,这是一个典型的组合优化问题(COP),随着系统复杂度的增加,计算量呈指数级增长。研究团队选择了一个具有重要生物学意义的靶点——LolA-LolCDE复合物,这是革兰氏阴性菌中负责脂蛋白转运的关键蛋白质复合物,破坏这一过程有望开发出针对耐药性革兰氏阴性菌的新型抗生素。
为开展这项研究,团队采用了多项关键技术:基于180纳米CMOS工艺与后端制程(BEOL)HfO2RRAM的存内计算(CIM)架构;高斯随机数发生器(GRNG)驱动的人工概率比特(p-bit)设计;动态斜率退火(DSA)算法;将分子对接问题转化为最大权重团问题(MWCP)并进一步表述为二次无约束二进制优化(QUBO)问题的计算框架;以及基于蛋白质数据库(PDB)结合数据集的知识结合势权重分配方法。
概率计算系统与存内计算兼容的人工可调概率比特
研究团队构建的p-computing平台基于离散Hopfield神经网络(DHNN)架构,通过引入RRAM存内偏置和高斯随机数发生器(GRNG)来调整p-bit在状态更新过程中的随机性。该系统使用HfO2基RRAM作为DHNN架构的核心器件,利用其高密度、低功耗和非易失性特性。实验表明,在适当的字线(WL)电压下,位线(BL)电流与激活的WL数量呈现良好的线性关系,而阵列内随机偏置(IARB)方法则实现了可调的p-bit功能。这种设计与传统的基于真随机数发生器(TRNG)的RRAM系统不同,它采用可控的高斯分布阈值来激活p-bit,其输出概率随MAC输入呈现典型的S型随机特性。
分子对接到最大权重团问题的转化
研究人员将分子对接问题转化为图论中的最大权重团问题(MWCP)。他们在脂蛋白上识别了6个药效团点(PP),在LolA-LolCDE蛋白质复合物上识别了7个PP,这些点根据化学性质分为疏水性和氢键供体/受体类别。通过空间兼容性检查(基于欧几里得距离的特定标准)后,构建了一个包含42个顶点的结合相互作用图(BIG),其中每个顶点代表一个潜在的药效团结合对,边代表空间兼容性。每个顶点被赋予从PDBbind数据集导出的基于知识的结合势权重。最终,MWCP被转化为二次无约束二进制优化(QUBO)问题,通过能量函数的最小化来寻找最大权重的团结构。
42节点分子对接的实验演示
在实验部分,团队通过调节GRNG的标准差σ来控制系统随机性,进行了100次独立实验 trial。结果显示,在较高随机性(σ=2.0)下,系统能量波动显著,能广泛探索解空间但难以稳定在最优解;随着σ降低至0.5,系统在探索和识别之间达到平衡,首次成功识别出理论最优解;而当σ进一步降至0.2时,由于随机性不足,系统主要陷入局部最优解。应用动态斜率退火(DSA)策略后,系统成功概率从35%显著提升至72%,且首次命中全局最优解的平均迭代次数减少了约4.2倍。最终确定的MWC对应顶点1、9、17、25和41,分别代表结合药效团对hp1-HP1、hp2-HP2、hp3-HP3、hp4-HP4和ha1-HD1,形成了包含四对疏水相互作用和一个氢键的最稳定对接构型,与蛋白质-配体相互作用分析工具(PLIP)的分析结果高度一致。
研究结论与意义
这项研究通过器件-架构-算法协同设计,成功演示了基于可调人工p-bit的概率计算机在解决分子对接问题中的应用价值。实验证明,该RRAM-CIM p-computer原型机能够以72%的成功率解决源自LolA-LolCDE-脂蛋白复合物的42节点MWCP问题,规模超过了最先进的量子方法。在硬件效率方面,每个乘加运算(MAC)消耗8.7 pJ能量,执行时间为13 ns,对应能效约1620 GOPS/W。对于42节点对接问题,系统实现了解算时间553 μs,解算能量0.365 μJ,能效为2.8×106solutions/s/W。
与基于高斯玻色采样(GBS)和量子近似优化算法(QAOA)等量子方法相比,该p-computer提供了一步式解决方案,无需后处理算法,且硬件尺寸更紧凑(RRAM芯片仅6.5×4 mm2)。研究还展示了该架构的良好可扩展性,底层1.1 Mb RRAM-CMOS架构通过适当的调度和编码策略,原则上可扩展至400-500节点。
这项工作不仅为分子对接提供了高效解决方案,还将概率计算确立为一种变革性技术,有望应用于科学计算领域的各种复杂组合优化挑战。通过展示架构效率、算法鲁棒性和实际可扩展性,该研究为计算生物学应用的概率计算硬件实现奠定了基础,为药物发现及相关领域的未来发展提供了坚实平台。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号