基于关键点分组与双提示引导的拥挤场景遮挡感知多人姿态估计

【字体: 时间:2025年08月02日 来源:Journal of Visual Communication and Image Representation 3.1

编辑推荐:

  本文提出了一种创新的遮挡感知多人姿态估计(MPPE)方法KDG,通过关键点分组策略和双提示引导机制,有效解决了拥挤场景中关节遮挡难题。该方法采用师生网络蒸馏框架,在学生网络中根据关节灵活性差异(躯干近端/远端)分别设计全局(GIP)和局部(LIP)信息感知模块;在教师网络中引入CLIP视觉语言模型,创新性地结合粗略身体部位提示与细粒度关节可见性提示。实验在OCHuman和CrowdPose数据集上验证了其优越性。

  

Highlight亮点

• 提出基于关节运动灵活性的关键点分组策略,分别捕捉全局与局部上下文特征

• 整合CLIP模型表征关节级语义,设计双提示系统(粗略身体部位提示+细粒度关节提示)增强视觉-文本对齐

• 构建知识蒸馏框架,将教师网络中的视觉-语言知识迁移至学生网络

Conclusion结论

本研究提出的KDG方法通过创新性地结合关节运动学特性与多模态提示系统,在拥挤场景下实现了更精准的遮挡关节定位。关键点分组策略根据关节与躯干距离(近端/远端)自动分配全局(GIP)或局部(LIP)特征提取模块,而双提示机制则通过身体部位拓扑关系与关节可见性描述,显著提升了模型对遮挡关节的推理能力。在OCHuman(70%遮挡率)和CrowdPose等挑战性数据集上的实验表明,该方法较现有技术具有明显优势。

CRediT作者贡献声明

宋铁成:资源获取、概念设计、论文审阅、方法论

彭艺:初稿撰写、软件开发、数据管理、验证测试

刘春:数据可视化、调研分析

秦安勇:验证测试、初稿撰写

赵越:形式化分析、调研支持

杨峰:方法论设计、研究指导

高晨强:项目管理

(注:根据要求已去除文献引用标识[1][2]等及图示标识Fig.1,专业术语保留英文缩写并规范使用sub标签)

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号