
-
生物通官微
陪你抓住生命科技
跳动的脉搏
深度自加权多视图模糊聚类:基于非线性映射的共识隶属度优化方法
【字体: 大 中 小 】 时间:2025年07月31日 来源:Knowledge-Based Systems 7.6
编辑推荐:
针对多视图聚类(MvC)中标签不一致和浅层模型局限性问题,研究人员提出深度自加权多视图模糊聚类(DSwMFC)框架。通过深度自编码器非线性映射构建共识隶属度矩阵,结合熵正则化与自适应加权策略,在5个跨模态数据集上验证了其优越性,为处理多视图数据的模糊边界提供了新范式。
在当今大数据时代,视频、网页等对象常通过图像、声音、超链接等多视角(multi-view)产生异构数据。传统多视图聚类(MvC)方法如CCA(典型相关分析)、NMF(非负矩阵分解)等采用"分步策略",存在两大痛点:一是忽视不同视图对聚类贡献度的差异,二是线性模型难以捕捉复杂非线性结构。尤其面对天气数据这类模糊边界场景时,硬聚类(hard clustering)的"非此即彼"分配方式更显局限。
针对这些挑战,深圳大学广东省智能信息处理重点实验室和深圳市媒体安全重点实验室的Mei Shi、Xiaowei Zhao等研究人员在《Knowledge-Based Systems》发表创新成果。团队提出深度自加权多视图模糊聚类(DSwMFC)框架,首次将深度自编码器与模糊聚类深度融合:通过分层非线性映射挖掘视图特异性特征,构建样本与质心间的共识隶属度(consensus membership);独创性地让中间层与重构层样本共享模糊隶属关系,缩小潜在空间与原始空间的聚类差异;采用无需额外参数的自加权策略调整视图贡献度,并引入熵正则化调控隶属度均匀性。实验证明该方法在图像、网页、视频等5类数据集的四项指标上均超越现有技术。
关键技术包括:1) 基于深度自编码器的分层非线性投影;2) 跨视图共识隶属度矩阵构建;3) 熵正则化(entropy regularization)优化;4) 交替优化算法更新变量。
【Methodology】
研究团队设计了三阶段架构:首先通过深度自编码器将各视图样本非线性映射至潜在空间;其次建立共享的模糊隶属度矩阵,约束中间层与重构层样本的软分配一致性;最后采用自加权机制动态调整视图权重。优化过程中,交替更新网络参数与聚类中心,直至目标函数收敛。
【Performance Evaluation】
在Handwritten、BBCSport等数据集上的实验表明:DSwMFC的ACC(准确率)和NMI(标准化互信息)最高提升12.7%和9.3%,显著优于对比算法。消融实验验证了深度架构与模糊聚变的协同效应——深度特征提取使聚类性能平均提高6.2%,而共识隶属度机制进一步带来3.8%增益。
【Conclusion】
该研究突破传统MvC的线性建模局限,首次实现深度特征学习与模糊聚类的端到端优化。其创新点在于:1) 通过深度网络挖掘视图特异性非线性特征;2) 构建跨层共享的共识隶属度确保标签一致性;3) 参数自适应的加权策略增强模型鲁棒性。这项工作为处理医疗影像多模态融合、跨平台用户画像等复杂场景提供了新工具,相关技术已申请国家发明专利。文末作者指出,未来将探索基于注意力机制的动态权重分配,进一步提升对噪声视图的容错能力。
生物通微信公众号
知名企业招聘