基于半监督自动标注与提示驱动零样本学习的家禽多行为检测增强研究
《Computers and Electronics in Agriculture》:Enhancing poultry multi-behavior detection with semi-supervised auto-labeling and prompt-driven zero-shot recognition
【字体:
大
中
小
】
时间:2025年11月05日
来源:Computers and Electronics in Agriculture 8.9
编辑推荐:
本研究针对家禽行为监测中人工标注成本高、效率低的问题,开发了一种融合半监督学习与零样本学习的新型标签高效学习框架。研究人员通过构建包含11种常见行为的家禽数据集(I-200和I-640),结合2500张未标注图像进行半监督训练,最终使YOLOv9s模型在监督学习中达到81.1%精确度,而集成YOLOWorld文本提示特征的半监督I-640模型进一步将性能提升至86.9%精确度。该研究显著降低了人工标注需求,为家禽健康监测提供了可扩展的AI解决方案。
在全球化食品供应链中,家禽产业扮演着至关重要的角色,每年为人类提供大量的肉类和蛋类蛋白质来源。然而这个行业正面临着严峻挑战:动物福利保障体系尚不完善,疾病暴发风险持续存在,劳动力短缺问题日益凸显。传统的人工观察记录方式难以满足现代化养殖场对行为监测的实时性要求,而基于计算机视觉的智能监测系统又受限于海量数据标注的成本问题。
针对这一行业痛点,阿肯色大学生物与农业工程系的Ramesh Bahadur Bist团队在《Computers and Electronics in Agriculture》发表了一项创新研究,提出了一种融合半监督自动标注与提示驱动零样本学习的家禽多行为检测新范式。该研究旨在解决传统监督学习方法对标注数据高度依赖的瓶颈,通过智能算法大幅降低人工标注成本,同时提升多行为识别的准确率。
研究团队采用的技术方法主要包括:首先构建包含11种家禽行为的数据集(包括I-200子集的3870个实例和I-640子集的14552个实例),结合2500张未标注图像进行半监督训练;其次应用主动学习技术优化自动标注模型;最后集成提示驱动零样本检测模型(CLIP、GDINO和YOLOWorld)建立用户友好的文本检测系统。
通过对训练数据集的分析发现,觅食、进食和栖息是最常见的行为类型。所有目标行为均得到充分覆盖,为模型训练提供了均衡的数据基础。标注质量分析显示边界框的空间分布合理,为准确检测提供了保障。
研究表明,YOLOv9模型在监督学习中获得良好基线性能(精确度81.1%,召回率77.9%,F1分数79.5%),而采用2500张伪标注图像训练的半监督I-640模型性能进一步提升(精确度86.9%,召回率84.3%,F1分数84.9%)。集成YOLOWorld文本提示功能后,模型在特定行为检测方面表现更佳。
CRediT authorship contribution statement
根据作者贡献声明,Ramesh Bahadur Bist负责了研究的概念化、数据分析、方法论建立和论文撰写,Lilong Chai提供了资金支持和资源整合,其他合作者参与了调查和论文审阅工作。
该研究的创新之处在于将半监督学习与零样本学习有机结合,不仅显著提升了行为检测精度,还开发了直观的"提示即检测"功能,使养殖人员能够通过简单文本指令快速识别特定行为。这种技术突破为大规模家禽养殖场提供了一种可扩展的智能监测方案,有望推动畜牧业向数字化、智能化方向转型。通过降低对专家标注的依赖,该技术可以有效缩短模型部署周期,使更多中小型养殖场也能享受到AI技术带来的红利。
值得注意的是,研究团队采用的主动学习策略能够迭代优化伪标签质量,有效解决了半监督学习中常见的噪声标签问题。而零样本学习能力的引入,则使系统具备了检测未训练行为类型的潜力,极大增强了模型的适应性和扩展性。这些技术特点使得该研究不仅具有学术创新价值,更具备显著的产业化应用前景。
从行业发展视角来看,这项研究为实现精准畜牧业提供了关键技术支撑。通过实时监测家禽行为变化,养殖者可以及时发现健康异常、优化饲养管理策略,从而提升动物福利水平并降低经济损失。随着人工智能技术在现代农业中的深度融合,此类智能监测系统有望成为保障食品安全、促进可持续发展的重要工具。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号