基于机器视觉的放牧山羊群监测研究新进展 —— 解读《BiAF:基于机器视觉的动态山羊群检测与跟踪研究》
内蒙古大学电子信息工程学院的研究人员 Yun Hou、Mingjuan Han、Wei Fan 等,在Scientific Reports期刊上发表了名为BiAF: research on dynamic goat herd detection and tracking based on machine vision的论文。该研究成果对于推动智能牧场管理、优化草原资源利用、保障动物福利具有重要意义,为实现草畜平衡提供了创新的技术手段,有助于推动畜牧业朝着智能化、精准化方向发展。
一、研究背景
随着全球畜牧业规模的不断扩大,动物福利问题愈发受到关注。在牧场管理中,实现科学放牧、优化草原资源配置至关重要,而对牲畜放牧的有效监测是达成这些目标的关键。传统的牲畜放牧监测方法,如人工跟踪和佩戴式监测,不仅会干扰放牧牲畜的自然运动和进食行为,影响对放牧模式的深入研究,还存在劳动强度大、成本高、实时反馈能力有限等问题。例如,给动物配备 GPS 设备可能引发应激反应,破坏其正常行为模式 。
近年来,机器视觉技术在现代农业尤其是畜牧业中发挥着越来越重要的作用。它作为一种非接触式检测方法,能够实时观测动物的运动行为和健康状况,提升牲畜福利和管理水平。目前,已有不少研究尝试利用机器视觉技术进行牲畜监测。如 Bello R.W. 等人使用 Mask YOLOv7 模型检测和计数牛;Soares V.H.A. 等人结合 CNN 网络和无人机图像优化技术实现牛的检测与计数 ;Subedi 等人提出 YOLOv5s-pecking 和 YOLOv5x-pecking 模型用于跟踪蛋鸡行为 。但这些研究在处理复杂场景时仍存在精度不足等问题,且针对自由放牧牲畜的监测研究相对较少。在自由放牧场景下,由于光照变化、目标遮挡和变形等因素,牲畜监测面临巨大挑战。因此,开发一种高效、准确的自由放牧山羊群检测与跟踪算法迫在眉睫。
二、研究材料与方法
(一)数据采集
研究人员在内蒙古伊伟白绒山羊有限公司的牧场开展实验,利用 14 台紫光华智 IPC3526-X22R4-SI 200 万像素星光红外球型网络摄像机进行数据采集。实验从 2022 年 9 月 21 日持续至 9 月 30 日,期间牧场的第 8 号球型摄像机记录了山羊的进食活动,共获得 56 段时长总计 25 小时的视频。
为构建数据集,研究人员编写 Python 程序从视频中提取帧。考虑到山羊运动相对缓慢,将帧提取间隔设为 30 秒以减少冗余并捕捉足够变化。提取后对帧进行筛选,去除模糊、重复或无关图像,得到 2800 张高质量图像。随后,使用 LabelImg 标注工具将图像中的山羊标注为 “goat”,并以 PASCAL VOC 格式导出标注数据集。为进一步扩充数据集,采用随机旋转、缩放、翻转和颜色调整等数据增强技术,将数据集扩展至 14000 个样本,提高模型对光照、方向和尺度变化的鲁棒性。实验数据分为训练集(占 70%)、验证集(占 20%)和测试集(占 10%)。
(二)实验平台
研究采用基于 VOC 数据集预训练参数的 YOLO 模型。使用自适应矩估计(Adam)优化器,初始学习率设为 0.01,动量为 0.937,每 10 个 epoch 保存一次模型权重。在对比消融实验中,保持主要结构参数不变,从预训练模型开始初始训练,先冻结骨干特征层 50 个 epoch,之后解冻并训练至收敛,其他训练超参数包括批量大小为 8、训练轮数为 200、图像大小为 640×640 等。
(三)算法设计
- BiAF-YOLOv7 算法:该算法基于 YOLOv7-tiny 模型,名称 BiAF 融合了 “双向聚合特征”(Bi)和 “注意力融合”(AF)的设计理念,旨在提升多尺度特征提取和注意力优化能力。
- 改进高效层聚合网络:借鉴 Bi-FPN 思想,提出 Bi-ELAN 网络。通过去除 PANet 中无效的中间节点(如 P3 和 P7),引入跨尺度跳跃连接,优化特征融合方式。Bi-ELAN 使用加权双向特征融合连接替代原模块中的 Concat 连接,实现特征信息在不同尺度间的双向流动,提高特征融合效率和模型性能。
- 引入改进的 CBAM 注意力机制:利用 AFF 特征融合方法将通道注意力机制模块和空间注意力机制模块融合,形成 AF-CBAM 注意力模块。该模块能突出关键目标特征,抑制背景噪声。在每个改进的 ELAN 后添加 AF-CBAM,可优化特征图的空间分布,增强多尺度特征表示,提高模型的鲁棒性。
- 改进 SPPCSPC 模块:SPPCSPC 模块通过多尺度空间金字塔池化提升模型特征表示能力,但存在参数多、计算成本高的问题。研究采用 SPPF 思想优化 SPPCSPC,得到 SPPFCSPC 模块。SPPFCSPC 在保持感受野不变的同时提高了运算速度,减少了参数数量,有效降低模型复杂度。
- 优化锚框:针对手动设计锚框无法适应特定数据集目标分布的问题,研究使用 K-Means 聚类算法对锚框进行优化。通过计算样本与聚类中心的欧氏距离,将样本分配到距离最近的聚类中心,并不断更新聚类中心,直至达到最大迭代次数或聚类中心不再变化。最终得到适合山羊目标检测的 9 个最佳锚框。
(四)评估指标
研究采用精度(Precision)、召回率(Recall)、F1 分数和平均精度均值(mAP)等指标评估模型性能。精度表示分类为羊群样本中实际为羊群的样本比例;召回率反映模型正确识别羊群样本数量与实际羊群样本总数的关系;F1 分数综合考虑精度和召回率,平衡二者的负相关性;mAP 通过绘制精度 - 召回曲线(P-R 曲线)计算得到,用于衡量多目标检测算法的精度性能。
三、研究结果
(一)检测算法实验结果
研究选取 SSD、Faster R-CNN、YOLOv5l、YOLOv7、YOLOv7-tiny 和 YOLOv8s 等五种主流目标检测算法,与 BiAF-YOLOv7 算法在山羊目标检测数据集上进行对比分析。结果显示,在相同实验条件和数据集下,BiAF-YOLOv7 算法表现出色。其精度达到 94.5%,高于其他算法(SSD 为 80.4%、Faster R-CNN 为 87.3%、YOLOv5l 为 88.1%、YOLOv7 为 89.3%、YOLOv7-tiny 为 88.7%、YOLOv8s 为 90.3%);召回率为 96.7%,分别比其他算法高出 5.7 - 7.2% 不等;F1 分数为 94.8%,mAP@0.5 达到 96.0%,mAP@0.5:0.95 为 59.7%,均显著优于其他算法 。在单图像检测速度方面,BiAF-YOLOv7 算法为 42.3ms,虽比 YOLOv7-tiny 算法慢 4.1ms,但远快于 YOLOv7 算法。与 YOLOv8 相比,BiAF-YOLOv7 在 mAP@0.5 和召回率上分别高出 1.5% 和 2.3%,在自由放牧场景检测精度上优势明显。
从 P-R 曲线分析,BiAF-YOLOv7 算法曲线的包络基本包含其他六种算法的曲线,表明该算法性能优于对比算法。这一系列实验结果充分证明 BiAF-YOLOv7 算法在检测精度和速度上达到了较好的平衡,能够高效准确地检测山羊目标。
(二)检测算法消融实验结果
为验证改进方法各步骤的有效性,研究进行了 BiAF-YOLOv7 算法的消融实验。实验 1 仅使用基线网络模型 YOLOv7-tiny,各项指标(精度、召回率、F1 分数、mAP@0.5)约为 90%。实验 2 将 YOLOv7-tiny 中的 ELAN 改进为 Bi-ELAN 后,精度提高 1.6%,召回率提高 0.5%,F1 分数提高 0.6%,mAP 值提高 1.2%,表明 Bi-ELAN 能增强模型对重要特征的识别能力。实验 3 在实验 2 基础上添加 AF-CBAM 注意力模块,精度提升 1.6%,F1 分数提高 2.3%,mAP 值增加 1.7%,但召回率略有下降,说明该模块优化了特征图的空间分布,增强了关键特征表达。实验 4 用 SPPFCSPC 替换 SPPCSPC,精度提高 0.9%,召回率提高 2.3%,F1 分数和 mAP 值分别提升 1.2% 和 0.5%,体现了新模块在提高检测性能方面的作用。实验 5 使用 K-Means 聚类得到的锚框替换原锚框,精度提高 1.7%,召回率提高 2.6%,F1 分数和 mAP 值均提升 1.6%,表明聚类后的锚框更适配数据集,提升了检测的准确性和速度。
从消融实验的 P-R 曲线和对比直方图可以直观看出,BiAF-YOLOv7 算法在精度、召回率、F1 分数和 mAP 值四个指标上表现优异,进一步验证了该算法改进步骤的有效性。
(三)与 DeepSORT 结合的跟踪实验结果
研究将 BiAF-YOLOv7 算法与 DeepSORT 跟踪算法相结合,在低光照、目标变形和遮挡等复杂场景下进行测试。结果表明,在低光照条件下,BiAF-YOLOv7-DeepSORT 算法能有效检测和跟踪山羊,即使山羊形状变化、聚集或分散,也能保持稳定的 ID 跟踪。当检测目标形状发生显著变化时,该算法能及时调整检测和跟踪框,准确跟踪目标。在目标被遮挡的场景中,BiAF-YOLOv7-DeepSORT 算法相比 YOLOv7-tiny-DeepSORT 算法,ID 跳跃次数显著减少(分别为 3 次和 8 次),检测准确率更高(94.6% 对比 92.4%),误识别和漏识别数量更少,IDF1 分数从 90.43% 提升至 93.07%,充分证明其在复杂场景下具有更强的目标检测和跟踪能力,稳定性和可靠性更高。
四、研究结论与讨论
(一)研究结论
本研究成功改进 YOLOv7-tiny 模型,提出 BiAF-YOLOv7 算法,有效解决了自由放牧山羊群检测与跟踪中的诸多问题。通过一系列改进措施,包括使用 Bi-ELAN 网络替换原 ELAN 网络、引入 AF-CBAM 注意力机制、优化 SPPCSPC 模块和使用 K-Means 聚类优化锚框,BiAF-YOLOv7 算法在检测精度上取得显著提升。在相同实验条件和数据集下,其精度、召回率、F1 分数和 mAP 值分别达到 94.5%、96.7%、94.8% 和 96.0%,优于多种主流目标检测算法。
与 DeepSORT 结合后,BiAF-YOLOv7-DeepSORT 算法在低光照、目标变形和遮挡等复杂场景下,对山羊群的跟踪表现出更高的准确性和更强的鲁棒性,有效减少了 ID 跳跃、误识别和漏识别情况,提高了跟踪目标身份一致性。
(二)讨论
精准畜牧日益受到重视,实现牲畜与牧场资源的平衡是关键挑战。本研究中 BiAF-YOLOv7 算法利用牧场安装的摄像头,有效解决了光照、遮挡等因素导致的羊群跟踪精度不足问题,为牧场管理者提供了准确监测山羊实时位置和行为状态的有效手段,提高了牧场管理效率,推动了精准畜牧的发展。
与以往研究相比,该算法在复杂环境下表现更优。例如,Vayssade J. 等人的山羊跟踪算法在复杂环境中表现不稳定,而 BiAF-YOLOv7 算法能有效应对多目标混合、光照变化和遮挡等挑战。Bonneau M. 等人的研究主要依赖简化的图像处理方法,对小目标和复杂环境下的目标行为分析不足,BiAF-YOLOv7 算法通过双向特征聚合和多尺度信息流优化,显著提升了在复杂牧场环境中的鲁棒性。Soares V. 等人的研究面临 GPS 信号干扰和识别精度问题,本研究则通过计算机视觉技术克服了这些局限,实现更准确、更鲁棒的实时检测。
然而,本研究也存在一定局限性。模型在极端天气条件(如浓雾、暴雨)下的鲁棒性有待进一步验证。未来研究计划利用剩余 13 台摄像头扩展对牧场内山羊及其他动物的监测范围,并深入分析山羊的具体进食和运动行为,绘制其轨迹,结合高光谱成像技术评估植被动态,以实现更全面的实时监测,为实现可持续的草畜平衡提供更多创新方法。
综上所述,本研究提出的 BiAF-YOLOv7 算法为基于机器视觉的牲畜放牧监测提供了有效解决方案,在推动畜牧业智能化发展方面具有重要的理论和实践意义,虽然存在局限,但后续研究方向明确,有望进一步完善和拓展相关技术应用。