编辑推荐:
为解决包裹递送员(PDWs)慢性踝关节不稳(CAI)的分类及预防管理问题,韩国延世大学研究人员开展基于机器学习技术的研究。结果显示相关模型预测性能良好且明确关键因素,对预防和管理 PDWs 的 CAI 意义重大,值得一读。
韩国延世大学(Yonsei University)健康科学学院 KEMA 人工智能研究实验室(Laboratory of KEMA AI Research, KAIR)和基于运动分析的运动人体工程学实验室(Laboratory of Kinetic Ergocise Based on Movement Analysis)的 Ui-jae Hwang、Oh-yun Kwon、Jun-hee Kim 和 Gyeong-tae Gwak 等研究人员,在《BMC Medical Informatics and Decision Making》期刊上发表了题为 “Factors contributing to chronic ankle instability in parcel delivery workers based on machine learning techniques” 的论文。这篇论文在物流行业员工健康管理以及慢性踝关节不稳(Chronic Ankle Instability,CAI)研究领域意义重大,为预防和管理包裹递送员的 CAI 提供了新的思路和方法。
一、研究背景
随着全球经济中网购和电子商务的发展,物流和零售行业迅速崛起,包裹递送员(Parcel Delivery Workers,PDWs)的数量不断增加。PDWs 在工作中需要搬运各种重量、尺寸和形状的包裹,工作模式包括驾驶和步行,平均每天步行距离可达 8 千米。然而,他们的工作环境复杂多变,在户外递送过程中,踝关节受伤的风险极高,踝关节扭伤是 PDWs 中最常见的工作相关肌肉骨骼疾病之一,且多由绊倒引起。
踝关节扭伤不仅复发率高,还与慢性踝关节不稳密切相关。一旦发展为 CAI,会导致患者反复出现踝关节 “打软腿”、不稳定感,严重影响生活质量和工作能力,还会造成大量的工作日损失。以往研究表明,CAI 的发生与多种因素有关,包括感觉 - 知觉和运动 - 行为障碍等功能不足因素,像姿势控制受损、踝关节活动范围(Range of Motion,ROM)受限、踝关节外翻肌力减弱、解剖结构畸形等 。但这些因素之间的关系复杂,是独立还是相互作用导致 CAI,在研究人员和临床医生中仍存在争议。
传统的 CAI 分类建模研究多采用线性或逻辑回归方法,但当结果与影响因素之间存在非线性关系时,这些方法就存在局限性。而机器学习(Machine Learning,ML)算法能处理高度非线性和线性关系,在医学分类任务中展现出独特优势。因此,本研究旨在利用姿势控制、踝关节 ROM、踝关节肌肉力量和解剖畸形等变量,开发、评估和比较统计机器学习模型对 PDWs 是否患有 CAI 的预测性能,并找出影响 CAI 的关键因素,为预防和管理 PDWs 的 CAI 提供帮助。
二、研究方法
- 参与者:研究人员筛选了 244 名从事包裹递送工作超过 6 个月的 PDWs。这些数据来自 2021 年 8 月至 2022 年 3 月期间,在一家快递公司的肌肉骨骼健康护理中心进行的预防工伤肌肉骨骼筛查测试。由于研究是基于快递公司已获取的数据进行分析,机构审查委员会豁免了知情同意。根据踝关节扭伤史和稳定性状况,参与者被分为对照组(184 人)和 CAI 组(60 人,占 24.6%)。排除标准包括近期(<6 个月)有下肢手术史、踝关节骨关节炎诊断或踝关节手术涉及关节内固定史的人员。
- 测量指标
- 姿势控制:通过 Y 平衡测试(Y-balance test,YBT)和闭眼单腿站立(Eyes-closed single-limb stance,ECSLS)测试评估。YBT 要求参与者双手放在胸前,尽可能向三个方向伸展;ECSLS 测试则要求参与者单腿站立,双手叉腰,闭眼保持 20 秒,若无法保持可重新尝试。
- 踝关节活动范围:使用安装 Clinometer 应用程序的智能手机测量踝关节背屈 ROM 和弓步角度。测量背屈 ROM 时,参与者坐在检查台上,小腿远端伸出桌沿,测试者被动背屈距小腿关节;测量弓步角度时,参与者在特定姿势下进行弓步动作,用手机测量胫骨角度。
- 踝关节肌肉力量:运用 Smart KEMA 力量传感器,在跖骨远端固定传感器,分别测量踝关节外翻肌、内翻肌和背屈肌在不同位置的力量,并计算外翻肌与内翻肌、背屈肌的力量比值。
- 解剖畸形:测量舟骨下降(navicular drop)和静息跟骨站立位(Resting calcaneal stance position,RCSP)。舟骨下降是指距下关节中立位和放松位时舟骨结节与地面距离的差值;RCSP 则是通过在跟骨上标记点,测量站立时跟骨平分线与垂直地面线的夹角。
- 数据处理与建模:研究纳入了 13 个预测变量,包括 12 个数值变量(年龄、体重指数(Body Mass Index,BMI)、工作时长等)和 1 个分类变量(ECSLS 测试是否成功)。利用探索性数据分析确认缺失数据并进行插补,通过箱线图去除异常值。运用 Orange 数据挖掘软件和 Python 进行 ML 分析,将完整数据分为训练集(80%)和测试集(20%),使用 10 折交叉验证训练 5 种 ML 算法,包括 LASSO 逻辑回归、极端梯度提升机、支持向量机、朴素贝叶斯机和随机森林。通过计算训练集和测试集的曲线下面积(Area Under the Curve,AUC)、分类精度、召回率和 F1 分数评估模型性能,还计算了特征排列重要性和 Shapley 加性解释值,以确定重要预测因素。
三、研究结果
- PDWs 特征:参与 ML 分析的 244 名 PDWs 均为男性。CAI 组和非 CAI 组在年龄、工作时长上无显著差异,但在 BMI、踝关节肌肉力量、踝关节背屈 ROM、弓步角度、YBT 得分、ECSLS 测试成功率等方面存在显著差异。例如,CAI 组的 BMI 更高,踝关节背屈 ROM 更小,YBT 得分更低。
- 机器学习预测模型:在训练阶段,支持向量机(AUC 为 0.807,表现良好)和随机森林(AUC 为 0.800,表现良好)模型在预测 PDWs 是否患有 CAI 方面表现出色;在测试阶段,随机森林模型表现最佳(AUC 为 0.853,表现良好),其次是极端梯度提升机和 LASSO 逻辑回归模型。
通过特征排列重要性分析,不同模型中影响 CAI 的重要预测因素有所不同。在支持向量机模型中,ECSLS 测试成功与否、踝关节背屈 ROM、RCSP 等是重要预测因素;在随机森林模型中,踝关节背屈 ROM、外翻肌与内翻肌力量比值、年龄等较为重要。利用 Shapley 加性解释分析发现,多个模型中低踝关节背屈 ROM、低弓步角度、高 BMI、老年、ECSLS 测试平衡重试次数多以及中立位外翻肌与内翻肌力量比值低等变量较为重要。
四、研究结论与讨论
本研究表明,机器学习方法能够有效利用多种临床测量指标对 PDWs 是否患有 CAI 进行分类,其中随机森林模型在 5 种测试模型中表现最佳。研究确定了多个影响 CAI 的关键因素,为临床干预提供了明确方向。例如,通过关节松动技术和拉伸运动可改善踝关节背屈 ROM 和弓步角度;针对性的肌肉强化训练可调整外翻肌与内翻肌力量比值;结合闭眼条件的平衡训练有助于改善姿势控制;通过适当运动和生活方式改变控制 BMI,也能对预防和管理 CAI 起到积极作用。
与以往研究相比,本研究使用多种变量分类 CAI,提升了模型性能。随机森林和支持向量机模型在区分 PDWs 是否患有 CAI 方面,表现优于逻辑回归模型,这可能得益于它们捕捉数据复杂关系的能力,但这些复杂关系还需进一步研究。研究还发现,高 BMI 和年龄是 CAI 的重要预测因素,这对于经常搬运重物的 PDWs 群体意义重大,表明身体成分和年龄与踝关节稳定性密切相关。此外,ECSLS 测试平衡重试次数多和中立位外翻肌与内翻肌力量比值低,也在多个模型中被确定为重要因素,凸显了姿势控制和肌肉力量平衡在踝关节稳定性中的关键作用。
不过,本研究也存在一些局限性。样本量有限且数据不平衡,可能导致过拟合风险增加,未来需要更大规模、更广泛人群的研究来提高 ML 模型预测 CAI 的准确性。评估方法也有待完善,应纳入更多患者报告的结局指标,更全面地评估功能限制和不稳定症状,同时量化不稳定发作的频率。由于 ML 算法种类繁多,可能存在未被选择的更优模型。研究未测量一些可能影响 CAI 的病理力学和感觉 - 知觉损伤因素,若将这些因素纳入模型,或许能提升模型性能。此外,虽然现有统计测试可比较不同 ML 算法,但还需单独的验证研究进行确认,且研究结果需前瞻性研究进一步验证其临床实用性。
总体而言,本研究开发的临床 ML 模型对 PDWs 的 CAI 具有良好的预测性能,确定的影响因素可作为预防和管理 PDWs 的 CAI 的临床指导,为后续研究和临床实践提供了重要参考,有望推动该领域的进一步发展。