葡萄园复杂采摘场景下基于语义推理的采摘点定位方法

【字体: 时间:2025年05月27日 来源:Artificial Intelligence in Agriculture 8.2

编辑推荐:

  针对葡萄园复杂场景中果梗短、遮挡及误识别等导致采摘机器人定位误差的问题,研究人员开展基于语义推理的采摘点定位研究。采用 SegFormer 模型,设计 SRM、RTAS、PPOM 模块,成功提升定位成功率至 94.96%,为智能采摘提供新方案。

  
在智慧农业蓬勃发展的今天,水果采摘自动化是提升农业效率的关键方向。然而,葡萄采摘面临着复杂的现实挑战:果梗短小时难以精准定位,枝叶遮挡常导致识别偏差,传统算法在这些情况下容易出现定位失误,严重影响采摘机器人的作业效率。如何让机器人在藤蔓交错、光影斑驳的葡萄园中准确找到最佳采摘点,成为制约智能采摘技术落地的瓶颈。为突破这一困境,国内研究团队聚焦葡萄采摘的核心难题,在《Artificial Intelligence in Agriculture》发表研究,探索基于语义推理的智能定位方案。

该研究由国内研究人员开展,旨在解决复杂果园环境中葡萄采摘点的精准定位问题。研究团队提出一种改进的采摘点定位算法,通过引入语义推理模块(SRM)、ROI 阈值调整策略(RTAS)和采摘点优化模块(PPOM),显著提升了机器人在短果梗、遮挡、误识别等复杂场景下的定位能力。实验表明,优化后的算法成功率达到 94.96%,较基线算法提升 8.12%,且平均处理时间仅为 0.5428±0.0063 秒,满足实时采摘需求。这一成果为葡萄采摘机器人的实际应用奠定了关键技术基础,推动了农业智能化进程。

研究主要采用以下技术方法:首先利用 SegFormer 语义分割模型对葡萄图像进行像素级分类,获取高精度语义信息;然后通过 SRM 模块对果梗被遮挡或误识别的场景进行推理,基于形态特征和空间关系优化定位;RTAS 模块针对短低果梗场景自适应调整感兴趣区域(ROI)阈值;最后通过 PPOM 模块结合果梗形态和空间位置优化最终采摘点坐标。实验数据来自包含 2460 张图像的复杂场景数据集,涵盖常见场景(CS)、短低果梗场景(SLGPS)、果梗遮挡与误识别场景(GPOMS)和严重误识别场景(SMGP)。

3. 实验结果


3.1 语义分割性能


对比 Deeplab v3、PSPNet 等模型,SegFormer-B2 表现最优,mIoU 达 84.54%,果梗(P_IoU=75.63%)和枝条(B_IoU=73.90%)的分割精度满足后续定位需求,表明其在复杂果园环境中具备较强的语义感知能力。

3.2 采摘点定位效果


改进算法在 CS、SLGPS、GPOMS、SMGP 场景下的失败率显著降低,总体成功率达 94.96%。其中,RTAS 模块使 SLGPS 场景失败率从 94 例降至 18 例,SRM 模块在 SMGP 场景中失败率从 103 例降至 24 例,验证了各模块的有效性。

3.3 处理效率


SegFormer 模型平均预测时间为 0.1278±0.0240 秒,定位算法推理时间 0.5428±0.0063 秒,总处理时间 0.6707±0.0236 秒,满足实时性要求,适合实际采摘作业。

3.4 失败案例与数据增强分析


部分失败案例源于语义分割模型对形态相似的叶梗与果梗误分类,或复杂遮挡导致的几何特征缺失。数据增强实验显示,模糊处理会降低定位成功率,提示实际应用中需减少图像模糊。

研究结论表明,基于语义推理的采摘点定位方法显著提升了葡萄采摘机器人在复杂场景中的定位精度与可靠性。通过感知 - 认知框架的构建,结合语义推理与形态特征分析,该算法突破了传统端到端模型的局限性,为农业机器人处理小目标、低语义信息场景提供了新思路。尽管当前研究依赖 2D 图像存在堆叠场景语义丢失的局限,但提出引入 3D 点云技术的未来方向,有望进一步提升空间定位能力。该研究不仅解决了葡萄采摘的实际问题,更为智能农业装备的算法设计提供了可借鉴的方法论,推动人工智能在精准农业中的深度应用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号