编辑推荐:
随着生成对抗网络(GAN)技术发展,假虹膜图像用于攻击生物识别系统风险增加。研究人员开展基于并行全局与局部注意力视觉 Transformer 的 GAN(PGLAV-GAN)研究。结果显示该模型生成的假虹膜图像更逼真,能提升呈现攻击检测(PAD)性能,增强虹膜识别系统安全性。
在当今数字化时代,生物识别技术广泛应用于各个领域,为人们的生活和工作带来了极大的便利。其中,虹膜识别以其高度的准确性和安全性,成为了备受瞩目的生物识别方式之一。然而,生成对抗网络(GAN)技术的迅猛发展,却给虹膜识别系统带来了巨大的挑战。利用 GAN 生成的假虹膜图像越来越逼真,这些图像被用于呈现攻击(Presentation Attack,PA),试图欺骗虹膜识别系统,严重威胁到了生物识别系统的安全性。在以往的研究中,许多生成假虹膜图像的 GAN 方法存在缺陷,比如无法有效消除 “GAN 指纹”,使得卷积神经网络(CNN)很容易区分真假虹膜图像。而且,这些方法生成的假虹膜图像在频率域上与真实图像存在差异,通过简单的后处理修改频率域特征,又会导致 PAD 模型性能下降。此外,在虹膜识别领域,针对考虑频率域差异(如 GAN 指纹)来生成更接近真实虹膜图像的 GAN 研究还十分匮乏。
为了解决这些问题,来自未知研究机构的研究人员开展了一项关于生成假虹膜图像的研究。他们提出了一种基于并行全局与局部注意力视觉 Transformer 的生成对抗网络(PGLAV-GAN),旨在提高虹膜识别系统中 PAD 的有效性。研究人员通过实验验证了该模型的性能,相关成果发表在《Engineering Applications of Artificial Intelligence》上。
研究人员在研究过程中运用了多种关键技术方法。首先,采用了 UNet++ 作为生成器的骨干网络架构,它能够有效整合多分辨率特征图,减少特征信息在编码过程中的损失。其次,引入了并行全局与局部注意力视觉 Transformer(PGLA-ViT),通过并行使用局部注意力和重新注意力机制,综合考虑局部和全局上下文信息。此外,还提出了傅里叶变换(FT)损失,通过最小化真实与假虹膜图像在频率域的差异,使生成的假虹膜图像在频率域特征上更接近真实图像。实验采用了 LiveDet-Iris-2017 的 Notre Dame Contact Lens Detection 数据集和 Warsaw 数据集进行验证。
研究结果如下:
- 模型训练效果:通过设置合适的训练参数,使用余弦退火热身学习率调度器,PGLAV-GAN 的训练损失曲线和验证损失曲线均随训练轮次增加而收敛,表明模型训练稳定且未出现过拟合现象。
- 消融实验:对比不同注意力模块,发现结合局部注意力和重新注意力的 PGLA 在生成假虹膜图像时,能使模型在 FID 和 LPIPS 指标上表现较好,同时在 D-NetPAD 和 LRFID-Net 等 PAD 模型中具有更高的错误率(即更高的 PA 性能),说明其生成的假虹膜图像更逼真。研究还发现,FT 损失和深度监督(DS)的结合,虽然在 FID 和 LPIPS 指标上不是最优,但能显著提高 PAD 模型的错误率,增强假虹膜图像的攻击效果。此外,对生成的假虹膜图像进行后处理,如伽马校正、高斯滤波、中值滤波和 JPEG 压缩等,会进一步降低 PAD 模型的性能,证明了该研究生成的假虹膜图像在未经额外处理时就具有较好的欺骗性。
- 与现有方法对比:与其他先进的 GAN 方法相比,PGLAV-GAN 生成的假虹膜图像在 FID 和 LPIPS 指标上表现更优,更接近真实虹膜图像。在 PAD 性能方面,使用 PGLAV-GAN 生成的假虹膜图像进行测试时,D-NetPAD 和 LRFID-Net 等模型的错误率更高,表明 PGLAV-GAN 生成的假虹膜图像更难以被识别,更适合用于测试 PAD 模型的鲁棒性。
研究结论和讨论部分指出,PGLAV-GAN 在生成假虹膜图像方面具有显著优势。该模型通过考虑全局和局部上下文信息,以及利用 FT 损失使生成的假虹膜图像在频率域上更接近真实图像,从而提高了假虹膜图像的质量和欺骗性。这一研究成果对于评估和提升虹膜识别系统的安全性具有重要意义。一方面,它为研究人员提供了一种更有效的生成假虹膜图像的方法,有助于开发更强大的 PAD 模型;另一方面,也促使虹膜识别系统的开发者更加关注系统在面对复杂攻击时的鲁棒性,推动生物识别技术不断完善和发展,以应对日益增长的安全威胁。总之,这项研究在生物识别安全领域迈出了重要一步,为后续研究奠定了坚实基础。