基于量子相对熵的量子神经网络训练新框架:提升混合态量子信道学习的精度与鲁棒性

《IEEE Transactions on Quantum Engineering》:Relative Entropy-based Training of Quantum Neural Networks

【字体: 时间:2025年12月09日 来源:IEEE Transactions on Quantum Engineering 4.6

编辑推荐:

  本文针对量子神经网络(QNN)在处理混合态量子数据时,传统基于保真度(fidelity)的损失函数在噪声和退相干环境下表现不佳的问题,提出了一种基于量子相对熵(quantum relative entropy)的新型训练框架。研究团队通过构建完全正定(CP)映射的QNN架构,开发了伴随信道(adjoint-channel)反向传播算法,并引入后处理步骤确保物理有效性。结果表明,该方法在单比特、双比特及三比特量子信道学习任务中,相比保真度基准在收敛性和泛化能力上均有显著提升,且在 depolarizing 噪声下仍保持稳定,为噪声中间尺度量子(NISQ)时代的量子机器学习提供了更可靠的优化路径。

  
在量子计算与机器学习交叉融合的前沿领域,量子神经网络(Quantum Neural Networks, QNNs)正展现出解决复杂问题的巨大潜力。然而,一个长期存在的挑战是如何有效地训练这些模型,尤其是在处理更为普遍和现实的混合量子态(mixed states)时。传统的训练方法大多依赖于基于保真度(fidelity)的损失函数,这类函数在处理纯态(pure states)时表现出色,但当量子系统的输入和输出是混合态时,其敏感性和可靠性便会大打折扣。混合态通常出现在学习量子信道(quantum channel)的任务中,因为真实的量子信道往往会受到环境噪声和退相干(decoherence)效应的影响,使得输入和输出状态都必须用密度矩阵(density matrices)来描述。因此,开发一种能够有效处理混合态数据的QNN训练框架,对于推动量子机器学习在噪声环境下的实际应用至关重要。
为了应对这一挑战,发表在《IEEE Transactions on Quantum Engineering》上的这项研究,引入了一种革新性的训练范式,其核心是使用量子相对熵(quantum relative entropy)作为损失函数。量子相对熵是信息论中的一个基本概念,它量化了两个量子态之间的统计差异性,能够同时捕捉态之间的特征向量对齐和光谱(特征值)分布差异。与仅关注状态重叠的线性保真度相比,相对熵提供了一个更具信息量和原则性的优化目标,特别适合于混合态场景。
研究人员基于现有的多层量子感知器(multi-layer perceptron, MLP)架构,构建了他们的QNN模型。该模型将量子感知器组织成层,每一层由一个完全正定(Completely Positive, CP)的过渡映射(transition map)
Tl表示。网络的整体演化是这些CP映射的序列组合,即 σxout= Tout(Tk(...T1xin)...))。每个感知器由一个酉矩阵(unitary matrix)Wpl表示。训练过程旨在最小化平均相对熵成本函数 C = (1/N) Σx=1NS(ρx|| σxout),其中 S(ρ || σ) = Tr(ρ ln ρ - ρ ln σ)。为了实现这一目标,研究团队开发了相应的伴随信道(adjoint-channel)反向传播算法,该算法是经典反向传播的量子类比。在每次迭代中,网络进行前向传播计算输出态 σxout,然后通过伴随CP映射 Gl将依赖于相对熵梯度的算子 Hx= ρxxout)-1从输出层反向传播至输入层,从而计算每个感知器参数矩阵 Vpl的梯度。一个关键的技术细节是确保 Hx是一个物理上有效的密度矩阵,研究通过后处理步骤(对称化和特征值阈值处理)来强制执行埃尔米特性(Hermiticity)、正定性和单位迹的约束。感知器的酉矩阵则通过 Wpl(t+δ) = eiδVpl(t)Wpl(t) 进行更新,以保持酉性。该方法在计算复杂度方面也进行了考量,为处理更大规模的输出层提供了可扩展的替代方案(如Woodbury矩阵求逆恒等式、对角摄动法或低秩近似)。
研究结果部分通过系统性的模拟实验验证了所提出框架的有效性。实验设置旨在评估QNN学习未知量子信道(包括酉变换和一般CPTP映射)的能力。训练数据通过将随机生成的混合输入态 σxin通过目标信道 T 传播以产生目标输出态 ρx来获得。研究比较了所提出的相对熵损失函数与现有线性保真度损失函数的性能。
单量子比特信道学习:实验测试了[1,1,1]、[1,3,1]和[1,2,3,2,1]等不同架构的QNN。结果表明,在所有架构中,相对熵方法均优于保真度基准。特别是具有中等宽度(如[1,3,1])的浅层网络表现出最大的性能提升,表明增加层宽度比增加深度更能有效提升学习效率。
双量子比特信道学习:在更复杂的双比特信道(希尔伯特空间维度为4x4)学习中,评估了[2,2,2]、[2,4,2]、[2,3,3,2]和[2,3,4,3,2]等架构。同样,相对熵方法在所有情况下都表现更优。[2,4,2]架构取得了最高的改进,再次证实了宽度优于深度的设计原则。
三量子比特信道学习:对于最具挑战性的三比特信道(希尔伯特空间维度为8x8),测试了[3,3,3]、[3,4,3]和[3,4,4,3]架构。结果趋势与单比特和双比特情况一致,[3,4,3]架构(更宽)的性能显著优于[3,3,3](更窄)和[3,4,4,3](更深),表明在较高维度下,增加隐藏层宽度仍然是提升性能的关键。
性能汇总表进一步以统计严谨的方式(包括95%置信区间)展示了相对熵方法的优势。在所有测试的配置中,基于相对熵的训练都达到了更低的最终相对熵值,表明学习到的信道与目标信道之间具有更强的对齐性。浅层但更宽的配置(如[1,3,1], [2,4,2], [3,4,3])显示出最大的相对优势。
对噪声的鲁棒性:为了评估框架在实际噪声条件下的稳定性,研究还测试了QNN在输入态受到 depolarizing 噪声(一种常见的退相干模型)扰动时的性能。噪声强度 ζ 在0.1到0.3之间变化。结果表明,即使存在这种噪声,相对熵成本函数仍能保持收敛行为,性能下降是可控的。这证明了该框架与NISQ时代固有的噪声特性具有内在兼容性,无需修改学习规则。
综上所述,这项研究成功地提出并验证了一种基于量子相对熵的QNN训练新框架。该框架通过利用信息论中更强大的差异性度量,显著提升了对混合量子态和量子信道的学习能力。研究不仅提供了详细的算法推导和实现细节,还通过广泛的实验证明了其在精度、收敛速度和噪声鲁棒性方面优于传统保真度方法。更重要的是,研究结果强调了QNN架构设计中“宽度优于深度”的原则,这对于在近期量子设备上实现实用量子机器学习具有重要指导意义。这项工作为在存在噪声和退相干的现实条件下,可靠地训练量子神经网络奠定了坚实的基础,标志着在实现强大且可扩展的量子学习模型方面迈出了关键一步。未来的工作可以探索将该框架应用于更复杂的噪声模型、开发硬件高效的实现方式以及无监督学习场景,进一步拓展量子机器学习的边界。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号