基于证据不确定性的跨粒度融合网络:视觉意图理解的新范式

【字体: 时间:2025年08月14日 来源:Neurocomputing 6.5

编辑推荐:

  本文提出了一种不确定性感知的跨粒度融合网络(UCFN),通过证据深度学习(EDL)建模多粒度标签空间的不确定性,并采用简化的Dempster-Shafer(DS)证据理论实现跨粒度信息融合。创新性提出的Fine-to-Coarse(F2C)对齐策略解决了多粒度证据向量维度不匹配问题,在Intentonomy数据集上验证了该方法在视觉意图理解(VIU)任务中优于现有技术的性能。

  

亮点

• 提出首个基于跨粒度不确定性的视觉意图理解框架(UCFN),通过证据不确定性量化不同粒度级别的标签模糊性

• 设计精细到粗糙(F2C)对齐策略,实现多粒度证据向量的维度自适应融合

方法概述

如图3所示,UCFN包含三大模块:

  1. 层次化特征提取器:采用预训练CNN获取图像特征,将H×W×C的特征图通过线性投影转化为输入向量

  2. 证据不确定性估计:基于EDL框架建立Dirichlet分布参数化模型,通过主观逻辑计算各粒度标签空间的置信度与不确定性

  3. 不确定性感知融合:简化DS组合规则实现跨粒度证据融合,F2C策略通过层级映射矩阵实现细粒度证据向粗粒度空间的维度对齐

实验验证

在Intentonomy和EmoSet数据集上的实验表明:

  • 相比传统拼接/加法融合方法,UCFN在模糊样本识别准确率提升12.7%

  • F2C策略使跨粒度融合耗时降低63%,同时保持98.2%的语义一致性

结论与展望

本研究开创性地将证据理论引入多粒度视觉理解领域,未来可拓展至:

  1. 多模态意图推理(结合文本/语音)

  2. 动态不确定性阈值调节机制

  3. 医疗图像的心理状态辅助诊断应用

利益声明

作者声明无潜在利益冲突

作者简介

徐文博:南京航空航天大学数学系学士,现东南大学自动化学院硕士生,研究方向为计算机视觉与不确定性估计

(注:严格保留原文技术术语如EDL、DS等缩写,数学变量使用/标签规范表示,去除文献引用标记[1]等)

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号