利用机器学习预测地下矿山穿梭车操作员的工作相关肌肉骨骼疾病
《Results in Engineering》:Predicting Work-related Musculoskeletal Disorders among Shuttle Car Operators in Underground Mines with Machine Learning
【字体:
大
中
小
】
时间:2025年11月17日
来源:Results in Engineering 7.9
编辑推荐:
工作相关肌肉骨骼疾病(WRMSDs)预测模型在井下矿车操作员中基于振动暴露和体态评估的研究。比较了随机森林、支持向量机、XGBoost、人工神经网络(ANN)、逻辑回归、决策树和K近邻7种机器学习模型的性能,ANN表现出最佳预测能力,AUC-ROC达0.9688,召回率100%。研究整合年龄、BMI、工龄、REBA评分、A(8)和VDV(8)等6个参数,验证了多因素非线性关系的建模优势。结论指出ANN在早期风险识别中具有临床价值,但需考虑计算成本和可解释性。未来应扩展数据维度并验证跨场景适用性。
在当今工业发展迅速的背景下,职业健康问题逐渐成为关注的焦点,尤其是在矿产资源开采行业。采矿作业环境往往伴随着高强度的体力劳动和复杂的工作条件,使得作业人员面临多种健康风险。其中,与工作相关的肌肉骨骼疾病(Work-Related Musculoskeletal Disorders, WRMSDs)尤为突出,特别是在采矿机械操作员群体中。这种疾病通常由长时间暴露于全身振动(Whole-Body Vibration, WBV)和不良人体工程学因素引起,给从业人员的身体健康和工作效率带来了严重影响。为了更有效地预测和干预WRMSDs,研究者们正在探索各种先进的技术手段,其中机器学习模型被广泛认为是一种有潜力的工具。
本研究聚焦于采矿作业中一种关键设备——穿梭车(Shuttle Car)操作员的WRMSDs风险预测。通过采集54名操作员的详细数据,包括年龄、体重指数(Body Mass Index, BMI)、工作年限、人体工程学评估(REBA评分)、每日频率加权均方根加速度(A(8))以及振动剂量值(VDV(8)),研究人员对七种机器学习模型进行了比较分析。这些模型包括随机森林(Random Forest, RF)、支持向量机(Support Vector Machine, SVM)、XGBoost、人工神经网络(Artificial Neural Network, ANN)、逻辑回归(Logistic Regression, LR)、决策树(Decision Tree, DT)和K-最近邻(K-Nearest Neighbors, KNN)。通过对这些模型的性能评估,研究旨在确定哪种模型能够更准确地预测WRMSDs的发生率和严重程度,从而为采矿行业的职业健康管理提供科学依据。
在研究过程中,数据采集涵盖了多个维度。首先,操作员的年龄、BMI、工作年限、REBA评分等基本信息通过面对面访谈获取,确保数据的全面性和准确性。其次,振动数据的测量遵循ISO 2631-1:1997标准,使用Norsonic Nor136振动计和Nor1288三轴座椅垫加速度计进行记录,确保数据的科学性和规范性。最后,通过分析操作员的主观反馈,结合Nordic Musculoskeletal Questionnaire(NMQ)评估其WRMSDs的严重程度。这些数据不仅反映了操作员的个体特征,还揭示了其工作环境对健康的影响。
研究结果表明,ANN模型在所有测试模型中表现最为出色。该模型实现了完美的召回率(100%),意味着没有高风险案例被遗漏。同时,ANN的AUC-ROC值达到0.9688,表明其在区分高风险和低风险个体方面具有较高的准确性。此外,ANN的准确率达到95.31%,F1得分达到0.9143,显示出其在敏感性和特异性之间的良好平衡。相比之下,其他模型如RF、SVM、XGBoost、LR、DT和KNN在各项指标上均有所逊色。例如,RF的准确率为96.88%,虽然接近ANN,但其召回率和AUC-ROC值略低。SVM和XGBoost的AUC-ROC分别为0.9375和0.8958,表明其在区分能力上不如ANN。而KNN则在召回率上表现最弱,仅为62.5%,显示出其在识别高风险个体方面的不足。
研究进一步指出,尽管ANN在敏感性方面表现出色,但其较低的精确率(84.21%)可能与数据集的不平衡有关。为了提高模型的性能,研究者采用了随机过采样(Random Oversampling)技术,以确保数据集中少数类样本的充分代表。这种方法虽然提升了ANN的召回率,但也可能导致模型对多数类样本的识别能力下降。相比之下,RF在准确率上表现更优,但其在召回率和精确率之间未能达到ANN那样的平衡。因此,模型的选择应基于实际应用场景的需求,如是否需要更高的敏感性或精确性。
此外,研究还探讨了不同模型在预测性能上的差异及其原因。例如,XGBoost的性能较低可能与其对小数据集的敏感性有关,而KNN则受到维度灾难(Curse of Dimensionality)的影响,难以有效识别高风险个体。这些发现强调了在选择机器学习模型时,需要综合考虑模型的性能指标、数据集的特性以及实际应用的需求。在采矿行业,WRMSDs的风险预测不仅需要高精度,还需要模型能够适应复杂的工作环境和多样化的操作条件。
从实际应用的角度来看,ANN虽然在预测性能上表现优异,但其“黑箱”特性可能限制其在职业健康管理系统中的广泛应用。相比之下,逻辑回归(LR)和随机森林(RF)在可解释性和计算效率上更具优势,适合用于实时筛查和风险沟通。因此,未来的研究应进一步探索如何在预测性能与模型可解释性之间找到平衡,以满足不同应用场景的需求。
本研究的成果不仅为采矿行业的职业健康管理提供了新的思路,也为其他高振动暴露行业(如建筑、农业和交通运输)的风险预测提供了参考。通过引入机器学习技术,研究者能够更有效地识别高风险个体,从而制定针对性的预防措施。然而,研究也指出了其局限性,如未考虑心理社会因素和环境变量(如照明、温度、湿度和噪音),这些因素可能对肌肉骨骼健康产生重要影响。因此,未来的研究应扩大数据范围,纳入更多影响因素,以提高模型的全面性和适用性。
总体而言,本研究通过比较七种机器学习模型,为WRMSDs的风险预测提供了科学依据。ANN模型因其高敏感性和强预测能力被证明是最有效的工具,而其他模型则在特定场景下展现出不同的优势。这些发现不仅有助于提升采矿行业的职业健康管理水平,也为其他高风险行业提供了有益的借鉴。未来,随着数据采集技术的进步和模型优化的深入,机器学习在职业健康领域的应用前景将更加广阔。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号