-
生物通官微
陪你抓住生命科技
跳动的脉搏
“UrBAN:城市蜂箱声学与表型数据集——基于多模态传感的蜂群健康监测新范式”
《Scientific Data》:UrBAN: Urban Beehive Acoustics and PheNotyping Dataset
【字体: 大 中 小 】 时间:2025年04月01日 来源:Scientific Data 5.8
编辑推荐:
编辑推荐:针对传统蜂箱监测方法劳动密集且干扰性强的问题,Mahsa Abdollahi团队通过部署IoT传感器网络,采集了10个蜂箱超过3000小时的音频、温湿度数据及表型指标,构建了首个包含原始音频的开放数据集UrBAN。研究验证了MFCCs特征预测蜂群规模的可行性(MAE 0.41±0.01),为AI驱动的精准养蜂提供了关键数据支撑,相关成果发表于《Scientific Data》。
加拿大魁北克大学INRS-EMT研究所的Mahsa Abdollahi团队联合Nectar Technologies公司,在蒙特利尔屋顶 apiary(45.5253°N,73.6123°W)部署了10个Langstroth标准蜂箱,通过SHTC1传感器和MEMS麦克风(SPK0641HT4H-1,20 Hz-20 kHz)采集了2021-2022年3171小时原始音频(16 kHz采样率)及温湿度数据(±0.3°C精度),同时记录蜂群表型指标包括:蜂框数量(Frames of bees,覆盖度≥70%)、蜂王状态(Queenright/Queenless)、Varroa mite(狄斯瓦螨)侵染率(酒精洗涤法)和冬季死亡率(20%)。该数据集UrBAN已公开于FRDR平台(DOI:10.20383/103.0972)。
关键技术包括:(1)谱幅度减法降噪(式1),采用自适应EMA滤波器(式2)和基于SNRa-posteriori(式4)的α参数调节;(2)特征提取:MFCCs(26个mel滤波器)、LFCCs、9种频谱形状描述符(质心、峭度等);(3)随机森林回归结合5种特征选择方法(mRMR、SHAP等),通过5折交叉验证评估蜂群规模预测性能。
主要结果:
数据特征验证
? 温度调控:强蜂群(30框)展现显著昼夜节律(图7a),日间音频RMS功率升高与外部温湿度变化相关(图8)
? 频谱特征:降噪后保留64 Hz/128 Hz/256 Hz生物信号(图11),蜂群规模与音频功率呈正相关(图9)
蜂群规模预测
? 随机分割实验:MFCCs特征表现最优(MAE 0.41±0.01,R2 0.96±0.00),显著优于LFCCs(p<0.001)
? 蜂箱独立实验:频谱描述符最佳(MAE 3.55±0.95),显示跨蜂箱泛化挑战
? 降噪提升:谱减法使MAPE降低4.7%(表6),证实环境噪声干扰模型性能
该研究创建了迄今最全面的开放蜂箱数据集,其创新性体现在:(1)首次提供3000+小时原始音频与表型数据关联;(2)验证声学特征(尤其MFCCs)作为蜂群规模代理指标的可行性;(3)开发可复用的谱减法降噪流程。局限在于冬季数据覆盖不足(仅20%蜂箱存活率记录),未来可结合SSL(自监督学习)挖掘未标注数据价值。这项工作为开发非侵入式蜂群监测系统奠定基础,对应对全球蜂群崩溃综合征(CCD)具有重要实践意义。
知名企业招聘