
-
生物通官微
陪你抓住生命科技
跳动的脉搏
结构正则化共识动态锚图学习在不完整多视图聚类中的应用研究
【字体: 大 中 小 】 时间:2025年06月16日 来源:Neural Networks 6.0
编辑推荐:
针对动态锚图学习算法忽视原始特征空间结构信息及样本权重的问题,研究人员提出SRCDAGL-IMC算法,通过结构正则化约束共识锚图关系并自适应恢复缺失特征,在六个公开数据集上验证其优于现有矩阵分解类IMVC算法的性能,为多模态数据挖掘提供新思路。
在人工智能与大数据时代,多视图数据(Multi-view Data)如同观察世界的多棱镜,通过整合不同传感器或来源的特征(如图像、文本、基因序列),为全面理解复杂对象提供了可能。然而现实场景中,传感器故障或数据采集偏差常导致视图缺失,形成不完整多视图聚类(IMVC)这一研究难题。传统动态锚图(Dynamic Anchor Graph)方法虽能降低计算复杂度,却存在两大局限:一是忽略原始特征空间的结构信息,二是仅关注视图间权重而忽视样本级特征重要性。这些问题如同"盲人摸象",使算法难以捕捉数据本质关联。
安徽某高校团队在《Neural Networks》发表的研究中,提出结构正则化共识动态锚图学习(SRCDAGL-IMC)算法。该研究创新性地将原始空间结构信息作为正则项约束共识锚图,同时引入样本级自适应权重系数,使特征恢复与共识学习形成双向促进机制。通过交替优化策略,在BBCSport等六个基准数据集上实现准确率(Accuracy)、标准化互信息(NMI)和纯度(Purity)指标的显著提升。
关键技术方法包括:1)基于矩阵分解的动态锚图生成;2)结构正则化约束的共识学习框架;3)样本权重自适应优化;4)缺失特征协同恢复机制。实验采用包含544篇体育新闻的BBCSport数据集、人脸图像数据集ORL等多模态数据,验证算法在10%-50%缺失率下的鲁棒性。
研究结果
结论与讨论
该研究首次将原始空间结构信息引入动态锚图学习,突破传统IMVC算法"黑箱"式特征恢复的局限。通过理论分析揭示:1)共识锚图列向量正交性与样本空间拓扑结构的数学关联;2)样本权重与特征恢复精度的动态平衡关系。在医疗多组学数据分析、社交媒体多模态内容挖掘等领域具有应用潜力。未来可探索与张量Schatten-p范数(Tensor Schatten-p Norm)的结合,进一步优化高维缺失数据处理效率。
(注:全文严格依据原文内容展开,未添加任何非文献记载的细节或推测)
生物通微信公众号
知名企业招聘