双编码器对抗学习在云网络安全入侵检测中的创新应用

《IEEE Open Journal of the Computer Society》:Dual-Encoder Adversarial Learning for Cloud-Based Cyber Intrusion Detection

【字体: 时间:2025年12月02日 来源:IEEE Open Journal of the Computer Society 8.2

编辑推荐:

  本文针对云系统面临日益复杂网络攻击的挑战,提出了一种基于双编码器对抗学习(Dual-Encoder Adversarial Learning)的新型入侵检测框架。该研究通过共享-私有编码器结构实现多域特征解耦,结合梯度反转层(GRL)进行对抗训练,有效提升了模型在异构云环境中的泛化能力。实验结果表明,该模型在UNSW-NB15和网络安全入侵检测数据集上的准确率达到91.7%,AUC为0.947,显著优于现有基线方法。这项研究为云环境下的自适应安全防护提供了重要技术支撑,对推动智能安全防御系统发展具有积极意义。

  
随着云计算技术的快速发展,云平台已成为现代数字基础设施的核心组成部分。然而,云环境的分布式、多租户和动态特性使其成为网络攻击的主要目标。传统入侵检测系统(IDS)通常基于规则或特征匹配,难以应对零日攻击和不断变化的威胁 landscape。特别是在处理网络流量和用户行为等多源异构数据时,现有方法往往缺乏跨域泛化能力,导致在真实云环境中的检测效果受限。
针对这一挑战,发表在《IEEE Open Journal of the Computer Society》上的研究提出了一种创新的双编码器对抗学习框架。该研究旨在开发一种能够从异构数据源中学习解耦且可泛化表示的云入侵检测模型,通过共享-私有编码器架构与对抗训练相结合,提高模型对域变化的鲁棒性。
研究团队采用了几项关键技术方法:首先构建了共享-私有编码器网络,其中私有编码器专门提取网络流量和用户行为等特定域特征,共享编码器则通过对抗训练学习域不变表示;其次引入梯度反转层(GRL)实现对抗训练,迫使共享编码器产生域不变特征;最后通过重构解码器保持潜在嵌入的语义保真度。实验使用了UNSW-NB15和网络安全入侵检测两个基准数据集,采用70:15:15的比例划分训练集、验证集和测试集。
分类性能比较:如表2所示,提出的双编码器对抗学习模型在准确率(0.917)、精确度(0.903)、召回率(0.910)、F1分数(0.906)和AUC(0.947)方面均优于所有基线方法。与传统机器学习方法如逻辑回归(0.843)和随机森林(0.871)相比,深度学习模型表现出明显优势,其中Transformer模型达到基线最高的准确率(0.903)。这表明双编码器结构能有效提升入侵检测的判别能力。
精确召回曲线面积比较:图2显示了各模型在精确召回曲线下的面积(PR-AUC),该指标在入侵检测中尤为重要,因为恶意活动相对良性流量较为罕见。提出的框架获得最高的PR-AUC分数0.912,表明其在不确定条件下能更好地平衡精确度和召回率。
训练准确率随周期变化:图3展示了模型训练准确率随训练周期的变化情况。模型表现出稳定的收敛行为,在第10个周期达到83.4%的准确率,第30个周期超过89%,最终在第50个周期收敛至91.7%。训练曲线的平滑上升趋势表明架构正则化(如解码器和对抗解缠组件)的有效性。
每类性能指标:表3提供了模型在测试集上五类主要流量(正常、DoS、侦察、漏洞利用和通用攻击)的详细评估结果。模型在所有类别上均表现出平衡且强大的性能,正常类别的F1分数为0.908,表明对非恶意流量识别的高准确性。其中,通用和DoS攻击的检测效果最佳,F1分数分别达到0.924和0.915。
跨域泛化性能:表4评估了模型从UNSW-NB15数据集到网络安全入侵数据集的泛化能力。提出的双编码器对抗学习模型在跨域设置下表现最佳,准确率达到84.1%,AUC为0.897,显著优于传统方法(如逻辑回归的0.716)。这验证了对抗特征解缠在学习鲁棒、域不变表示方面的有效性。
消融研究:组件贡献:表5通过消融实验分析了各架构组件对模型性能的影响。仅使用共享编码器时,所有指标显著下降,证实私有编码器对捕捉模态特定信号的重要性。去除解码器或对抗损失会导致AUC和F1分数进一步降低,表明重构正则化和域不变学习的必要性。完整模型(所有组件)取得最佳性能,证明联合特征解缠和跨域对抗训练的协同效益。
噪声鲁棒性评估:表6展示了模型在不同水平高斯噪声(σ从0.0到0.4)下的鲁棒性。所有模型随着噪声水平增加都出现性能下降,但提出的双编码器对抗学习模型在所有噪声水平下均保持最高准确率,从σ=0.0到σ=0.4仅相对下降10.5%,表明其对噪声输入具有增强的韧性。
训练曲线分析:图4和图5分别展示了扩展周期范围内的训练准确率以及训练和验证损失曲线。训练准确率从初始值83%以上稳步上升至92%以上,没有出现突然波动。训练和验证损失曲线均单调下降且彼此接近,证明模型收敛稳定且泛化能力强,没有出现过拟合现象。
研究结论表明,双编码器对抗学习框架为云系统提供了一种新颖且鲁棒的异常检测解决方案。通过域解耦表示学习、对抗训练和重构正则化的有机结合,该模型在分类准确率、跨域泛化、噪声鲁棒性和计算效率方面均表现出色。其轻量级设计和强大泛化能力使其适用于实时云安全部署。尽管当前设计在标记数据可获取性和结构化数据处理方面存在一定限制,但为未来研究指明了方向,包括融入半监督学习、扩展至多模态数据以及增强对抗防御能力等。这项研究为构建自适应、智能化的云安全防护体系提供了重要技术基础,对推动网络安全技术发展具有积极意义。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号