
-
生物通官微
陪你抓住生命科技
跳动的脉搏
面向移动机器人的多域室内视觉位置识别与异常检测数据集MDDRobots构建及验证
【字体: 大 中 小 】 时间:2025年05月20日 来源:Scientific Data 5.8
编辑推荐:
针对室内移动机器人视觉位置识别(VPR)和异常检测(AD)领域缺乏多域场景数据的问题,波兰热舒夫理工大学团队开发了包含89,550张RGB图像的MDDRobots数据集,涵盖9个房间、5种摄像头和2类机器人平台。研究采用ResNet-50特征提取结合隔离森林(IF)、单类支持向量机(OCSVM)和自编码器(AE)等方法,实现了最高84.18%的序列异常检测准确率,为复杂环境下的机器人自主导航提供了标准化评估基准。
在自主机器人技术快速发展的今天,室内环境中的精准定位和异常感知能力成为制约机器人实用化的关键瓶颈。传统视觉位置识别(VPR)系统常因光照变化、动态障碍物和硬件差异导致性能骤降,而现有数据集往往局限于单一传感器或静态场景,难以反映真实世界的复杂性。更棘手的是,当机器人遭遇未知环境或异常情况时,缺乏有效的检测机制可能导致导航失败甚至安全事故。这些挑战催生了波兰热舒夫理工大学Piotr Wozniak团队在《Scientific Data》发表的突破性研究。
研究团队创新性地构建了名为MDDRobots的多域室内数据集,通过融合人类手持设备和机器人平台采集的89,550张图像,覆盖9种室内场景、5类摄像头(Pi Camera/Xtion/GoPro/iPhone/P40Pro)和2种移动机器人(轮式/NAO人形机器人)。技术路线上,采用ResNet-50卷积神经网络提取2048维图像特征,对比测试了隔离森林(IF)、单类支持向量机(OCSVM)和自编码器(AE)三种异常检测算法,其中AE通过余弦距离计算原始特征与重建特征的差异,展现出最优性能。
研究结果部分,"Background & Summary"揭示了现有数据集的局限性:KTH-IDOL2等7个主流数据集平均仅覆盖2.3种协变因素,而MDDRobots首次整合了环境异常、序列图像、多机器人、人类活动等全部6类干扰因素。"Methods"章节显示,AE在单帧检测中达87.44%准确率,显著高于IF(75.20%)和OCSVM(77.37%);当采用序列中值滤波后,性能进一步提升至84.18%。"Data Records"详述了数据集结构,包含171个序列,图像分辨率从640×360到960×540不等,特别标注了人脸模糊等伦理处理。"Technical Validation"通过225组对比实验证实,光照变化使检测准确率下降12.7%,而人类活动干扰导致最大17.9%的性能波动。
这项研究的意义在于建立了首个支持多域评估的机器人视觉基准,其提出的"环境异常-设备差异-人为干扰"三级测试框架为VPR算法提供了严格验证标准。配套开源的MATLAB代码和34.3GB数据集(CC BY 4.0许可)将加速自适应导航算法的研发。正如作者Piotr Wozniak指出,该工作填补了复杂场景下机器人认知系统评估工具的空白,特别是对服务机器人在医院、商场等动态环境中的安全部署具有重要指导价值。未来研究可进一步探索多模态数据融合和在线学习机制,以应对更极端的异常场景挑战。
生物通微信公众号
知名企业招聘