《Scientific Reports》:Zero-shot incremental learning using spatial-frequency feature representations
编辑推荐:
在机器学习领域,模型存在灾难性遗忘问题,语义差距会导致这一现象加剧。研究人员开展零样本增量学习主题研究,提出 SFFRNet 网络。实验结果表明该方法优于现有算法,能有效缓解灾难性遗忘,提升模型性能,对推动增量学习发展意义重大。
在当今科技飞速发展的时代,机器学习如同一位神通广大的 “智能魔法师”,在医疗、雷达、图像分类等众多领域施展着神奇的力量,帮助人们解决各种各样复杂的问题。然而,这位 “魔法师” 却有着一个令人头疼的 “小毛病”—— 灾难性遗忘。
想象一下,当机器学习模型在学习新知识的时候,就像一个人在不断接收新信息,可它却会把之前学过的重要知识忘得一干二净,这就导致在面对旧数据时,模型的表现大打折扣。为什么会这样呢?原来,传统的模型假设数据的分布是固定或者平滑的,但现实世界中的数据就像变幻莫测的天气,根本不按常理出牌,新的数据往往会干扰旧知识的学习,让模型陷入混乱。
为了解决这个棘手的问题,来自西安工程大学、陕西科技大学等机构的研究人员开启了一场充满挑战的科研之旅。他们专注于零样本增量学习(Zero-shot incremental learning)的研究,旨在让模型在不遗忘旧知识的同时,还能对新的类别进行准确的识别和分类。经过不懈的努力,研究人员提出了一种全新的空间 - 频率特征表示网络(Spatial - Frequency Feature Representation Network,SFFRNet)。
研究人员在开展这项研究时,用到了几个主要关键的技术方法。首先,利用离散余弦变换(Discrete Cosine Transform,DCT)对输入图像进行处理,将图像从空间域转换到频率域,从而提取不同频率成分的特征。其次,构建了空间特征提取(Spatial Feature Extraction,SFE)模块和频率特征提取(Frequency Feature Extraction,FFE)模块,分别用于提取图像的空间和频率特征。此外,还设计了基于空间 - 频率域的注意力特征对齐(Attention Feature Alignment,AFA)模块,以及零样本翻译(Zero-shot translation)模块来补偿新旧特征嵌入之间的语义差距。
下面让我们一起来看看研究结果。
- 数据集选择与实验设置
研究人员选用了标准数据集 CUB - 200 - 2011 和 CIFAR - 100 进行实验。CUB - 200 - 2011 是一个细粒度的鸟类图像数据集,包含 11788 张图像,分布在 200 个鸟类类别和 312 个属性中;CIFAR - 100 则是一个粗粒度的数据集,有 100 个类别,每个类别包含 600 张 32×32 的彩色图像。所有模型都在 PyTorch 框架下实现,使用 Adam 优化器,以 ResNet - 12 作为预训练骨干网络,并对图像进行了相应的预处理。
- 评估指标
研究采用平均增量准确率(average incremental accuracy)和平均遗忘率(average forgetting)作为评估指标。平均增量准确率反映了测试集在整个任务中的整体性能,计算公式为Ak?=k1?∑j=1k?ak,j? ,其中ak,j?表示训练k个任务后第j个任务的准确率;平均遗忘率用于估计网络遗忘的知识量,计算公式为Fk?=k?11?∑j=1k?1?fjk? ,其中fjk?=maxl∈1,?,k?1?(al,j??ak,j?)。
- 实验对比结果
研究人员将 SFFRNet 与 7 种其他网络进行对比。结果显示,在 CUB - 200 - 2011 数据集上,配备 SFFRNet 的网络平均增量准确率达到 59.9%,相比原始基线网络 E - FT 提高了 23.0%,相比当前最先进的网络提高了 1.2%;在 CIFAR - 100 数据集上,平均增量准确率达到 53.7%,相比 E - FT 提高了 47.1%,相比最先进网络提高了 2.1%。这表明 SFFRNet 能更好地改善相邻任务之间的语义差距问题,缓解网络的灾难性遗忘,有效提升模型性能。
- 平均遗忘结果分析
随着类别数量的增加,所有方法的平均遗忘率都明显上升,这证明了嵌入网络中确实存在灾难性遗忘现象。但结合 SFFRNet 方法后,遗忘效应明显减轻,再次验证了该方法能有效缓解灾难性遗忘。
- AFA 模块的有效性验证
通过将 AFA 模块嵌入到现有方法中进行消融实验,结果表明,同时将空间注意力机制(SENet)和频率注意力机制(FcaNet)结合成 AFA 模块融入模型,比单独添加单一注意力机制能更好地缓解网络的灾难性遗忘,进一步证明了 AFA 模块的有效性。
综上所述,研究人员提出的 SFFRNet 为零样本增量学习提供了一种创新的解决方案。该网络通过 SFE 和 FFE 模块从空间和频率域捕捉显著信息,有效缩小了新旧类别之间的语义差距。融合后的特征增强了分类器的性能,提升了特征提取能力,减少了任务之间的距离。实验结果有力地证明了该方法在两个基准数据集上优于现有方法。这一研究成果对于推动机器学习领域的发展具有重要意义,为解决模型灾难性遗忘问题提供了新的思路和方法,有望在更多实际应用场景中发挥作用,助力人工智能技术更好地服务于人类社会。
婵炴垶鎸搁鍫澝归崶鈹惧亾閻熼偊妲圭€规挸瀛╃€靛ジ鏁傞悙顒佹瘎闁诲孩绋掗崝鎺楀礉閻旂厧违濠电姴娲犻崑鎾愁潩瀹曞洨鐣虹紓鍌欑濡粓宕曢鍛浄闁挎繂鐗撳Ο瀣煙濞茶骞橀柕鍥ㄥ哺瀵剟骞嶉鐣屾殸闂佽偐鐡旈崹铏櫠閸ф顥堥柛鎾茬娴狀垶鏌曢崱妤婂剱閻㈩垱澹嗗Σ鎰板閻欌偓濞层倕霉閿濆棙绀嬮柍褜鍓氭穱铏规崲閸愨晝顩烽柨婵嗙墦濡鏌涢幒鎴烆棡闁诲氦濮ょ粚閬嶅礃椤撶姷顔掗梺璇″枔閸斿骸鈻撻幋锔藉殥妞ゆ牗绮岄埛鏍煕濞嗘劕鐏╂鐐叉喘閹秹寮崒妤佹櫃
10x Genomics闂佸搫鍊瑰姗€骞栭—娓媠ium HD 閻庢鍠掗崑鎾绘煕濮樼厧鐏犵€规洜鍠撶槐鎺楀幢濮橆剙濮冮梺鍛婂笒濡粍銇旈幖浣瑰仢闁搞儮鏅滈悾閬嶆煕韫囧濮€婵炴潙妫滈妵鎰板即閻樼數鐓佺紓浣告湰濡炶棄螞閸ф绀嗛柛鈩冡缚閳ь兛绮欓弫宥夋晸閿燂拷
濠电偛妫庨崹鑲╂崲鐎n偆鈻旈悗锝庡幗缁佺櫉wist闂侀潧妫楅敃锝囩箔婢舵劕妫樻い鎾跺仜缂嶄線鏌涢弽銊у⒈婵炲牊鍘ISPR缂備焦绋掗惄顖炲焵椤掆偓椤︿即鎮ч崫銉ゆ勃闁逞屽墴婵″鈧綆鍓氶弳鈺呮倵濞戞瑥濮冮柛鏃撴嫹
闂佸憡顨嗗ú婊呭垝韫囨稒鍤勯柣鎰嚟閵堟挳骞栭弶鎴犵闁告瑥妫濆濠氬Ω閵夛絼娴烽柣鐘辩劍瑜板啴鎮ラ敓锟� - 濠电儑绲藉畷顒勫矗閸℃ḿ顩查柛鈩冾嚧閹烘挾顩烽幖杈剧秵閸庢垵鈽夐幘顖氫壕婵炴垶鎼╂禍婊冪暦閻旇櫣纾奸柛鈩冭壘閸旀帡鎮楅崷顓炰槐闁绘稒鐟ч幏瀣箲閹伴潧鎮侀梺鍛婂笧婢ф寮抽悢鐓庣妞ゆ柨鐏濈粣娑㈡煙鐠ㄥ鍊婚悷銏ゆ煕濞嗘ê鐏ユい顐㈩儔瀹曠娀寮介顐e浮瀵悂鏁撻敓锟�
婵炴垶鎸搁鍫澝归崶顒€违濠电姴瀚惌搴ㄦ煠瀹曞洤浠滈柛鐐存尦閹藉倻鈧綆鍓氶銈夋偣閹扳晛濡虹紒銊у閹峰懎饪伴崘銊р偓濠氭煛鐎n偄濮堥柡宀€鍠庨埢鏃堝即閻樿櫕姣勯柣搴㈢⊕閸旀帡宕濋悢鐓幬ラ柨鐕傛嫹