基于多方同态加密的大规模模型隐私保护联邦学习研究

【字体: 时间:2025年07月29日 来源:Pattern Recognition 7.5

编辑推荐:

  为解决联邦学习(FL)中梯度聚合过程的数据隐私泄露问题,研究人员提出了一种整合同态加密(HE)与掩码生成技术的新型隐私保护方案。该方案通过同态伪随机生成器(HPRG)实现单次加密种子即可保护d维梯度,相比现有方案提升计算效率5~10倍、通信效率3~7倍,支持高达N?2的共谋与掉线容忍度,为大规模模型隐私保护提供了实用解决方案。

  

在人工智能时代,数据隐私与协作学习之间的矛盾日益凸显。联邦学习(Federated Learning, FL)作为一种分布式机器学习框架,允许参与方在不共享原始数据的情况下协同训练模型,但其梯度交换过程仍存在隐私泄露风险——研究表明,攻击者可能通过逆向工程从梯度中推断敏感信息。现有隐私保护方案如差分隐私(DP)会降低模型精度,安全多方计算(SMPC)面临O(N2)通信开销,而同态加密(HE)虽能保证精度却因需逐维度加密d维梯度导致效率低下。

针对这一技术瓶颈,西南交通大学的研究团队在《Pattern Recognition》发表论文,创新性地将多方同态加密(MHE)与同态伪随机生成器(HPRG)相结合。该方案的核心突破在于:通过HPRG生成d维伪随机掩码保护本地梯度,仅需加密单个种子而非全部梯度维度,使计算/通信开销与维度d解耦。实验证明,对于4×105参数量的模型,其效率较现有最优(State-of-the-Art, SOTA)HE方案提升5-10倍,同时保持N?2的共谋与掉线容忍度。

关键技术包括:(1)基于HPRG的离线掩码生成技术;(2)支持N?2容错的多方同态加密协议;(3)服务器端聚合掩码重构机制。研究团队通过理论证明该方案满足语义安全,且首次实现HE类方案中计算开销与梯度维度的解耦。

【系统模型】构建包含N个客户端和1个服务器的标准FL架构,采用半诚实安全假设,要求保护梯度隐私且服务器只能获得聚合结果。

【安全分析】证明方案满足:客户端梯度隐私性、服务器结果独占性、N?2掉线容忍和N?2共谋抵抗。关键创新在于通过HPRG种子加密实现"一次加密全维度保护",突破传统HE的维度依赖瓶颈。

【性能对比】与基于阈值ElGamal的PCFL方案相比,计算耗时从O(d)降至O(1),400,000维梯度下加密耗时减少89.7%,通信量降低76.3%。在ResNet-18模型训练中,每轮时间从218.4秒缩短至28.7秒。

该研究标志着隐私保护联邦学习向实用化迈进的重要一步。其提出的"种子级加密"范式不仅适用于FL,还可拓展至分布式优化、安全聚合等场景。作者指出,未来工作将探索该方案在跨模态联邦学习中的应用,并进一步优化HPRG在GPU集群上的并行计算性能。这项由中国学者主导的研究,为平衡隐私保护与计算效率这一全球性难题提供了创新解决方案。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号