
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于二分图的两阶段自适应加权多视图共识聚类算法研究
【字体: 大 中 小 】 时间:2025年07月31日 来源:Pattern Recognition 7.6
编辑推荐:
针对多视图聚类中单视图与共识视图联合学习不足、单阶段融合策略局限及视图权重分配不合理等问题,山东财经大学管理科学与工程学院团队提出TWMVC-BG算法。该研究通过二分图构建多粒度视图组早期融合,结合非参数化自适应权重策略实现后期共识图优化,在7类数据集上实现10%-18%的性能提升,为复杂多源数据挖掘提供新范式。
随着医疗诊断、环境监测等领域多源数据的爆发式增长,多视图聚类(Multi-View Clustering, MVC)技术因其能整合不同视角的互补信息而成为研究热点。然而现有方法面临三大瓶颈:单视图与共识视图的割裂学习导致语义鸿沟,单阶段融合策略难以捕捉多层次关联,而固定权重分配则忽视了视图间的动态差异。这些局限严重制约了算法在复杂场景下的鲁棒性,亟需建立更系统的多阶段协同优化框架。
山东财经大学管理科学与工程学院的研究团队在《Pattern Recognition》发表的研究中,创新性地提出基于二分图的两阶段自适应加权多视图共识聚类算法(TWMVC-BG)。该研究通过早期随机视图组策略构建多粒度二分图,后期采用非参数化权重学习生成全局共识图,最终在7类数据集上实现显著性能突破。
关键技术方法包括:1) 随机视图组策略生成多样性视图组合;2) 基于锚点的二分图建模捕获多粒度特征(锚点、邻居、特征三个层次);3) 非参数自适应权重学习动态平衡视图贡献;4) 谱聚类(Spectral Clustering)求解共识图。实验选用WebKb等5个图像数据集和2个文本数据集,样本量从数百至数万不等。
早期阶段:多粒度视图组学习
通过随机组合生成多个视图组,每个组独立构建二分图。利用锚点(anchors)建立样本与特征的非线性映射,同步优化三个层次信息:锚点层面的跨视图关联、邻居层面的局部流形结构、特征层面的全局语义表达。该设计突破传统单锚点集的局限,获得多样性二分图集合{S(i)}。
后期阶段:自适应共识融合
将各视图组的{S(i)}作为输入,构建组内共识图。创新性地引入非参数权重策略,通过迭代优化自动平衡不同视图组贡献,避免人工设定权重的主观性。最终融合所有{S(i)}生成全局共识图U,其收敛性通过理论分析得到保证。
实验验证
在WebKb等7个数据集上的测试表明,TWMVC-BG在聚类准确率(ACC)和标准化互信息(NMI)指标上平均提升10%-18%。特别在特征维度差异大的视图间(如文本-图像混合数据),算法通过多阶段融合有效缓解了语义鸿沟,其鲁棒性显著优于对比算法。
该研究的突破性体现在三方面:首先,两阶段协同框架首次实现从多粒度差异挖掘到全局共识的端到端优化;其次,随机视图组策略增强算法可复现性,相比传统方法降低50%的初始矩阵敏感性;最后,非参数权重机制为多视图动态融合提供普适性解决方案。这些创新为医疗多模态数据整合、跨平台环境监测等场景提供新思路,相关技术已被应用于山东省重点研发计划支持的智能诊断项目。未来工作将探索超大规模数据下的分布式计算优化,进一步拓展算法应用边界。
生物通微信公众号
知名企业招聘