超越跌倒检测:基于混合CNN-LSTM-Attention框架的可穿戴惯性传感器在跌倒前、中、后阶段检测研究
《IEEE Access》:Beyond Falls: A Hybrid CNN–LSTM–Attention Framework for Pre-, Transition-, and Post-Fall Detection with Wearable Inertial Sensors
【字体:
大
中
小
】
时间:2025年12月09日
来源:IEEE Access 3.6
编辑推荐:
本研究针对老年人跌倒这一重大健康威胁,提出了一种基于混合CNN-LSTM-Attention框架的实时跌倒检测系统。该系统利用可穿戴惯性传感器(IMU)数据,首次实现了对跌倒前(pre-impact)、跌倒后(post-impact)及过渡期(transition)三个阶段的多类别(36类活动)精准识别,平均F1分数达98%,特异性达99%,推理时间仅20毫秒。这项工作在可扩展性、评估指标和实时性方面均优于现有方法,为老年人及残疾人的安全监护提供了强有力的技术支撑。
随着全球人口老龄化趋势加剧,独居老年人比例持续上升,跌倒已成为威胁老年人自主生活和身心健康的严重问题。世界卫生组织数据显示,65岁以上老年人中约有35%每年至少跌倒一次,70岁以上人群这一比例更高达42%。跌倒作为全球第二大意外伤害致死原因,每年导致约64.6万人死亡和3730万需要医疗干预的伤害事件。跌倒不仅造成身体损伤,还会引发恐惧、焦虑和抑郁等心理问题,严重影响生活质量。
传统跌倒检测系统主要分为非可穿戴式和可穿戴式。非可穿戴系统依赖环境传感器,存在部署受限、易受环境干扰等缺点。而可穿戴系统,特别是基于惯性测量单元(Inertial Measurement Unit, IMU)的设备,因其非侵入性、成本效益高和可连续监测等优势,成为研究热点。IMU包含加速度计、陀螺仪和磁力计,能够捕捉线性加速度、角速度和磁场方向等运动信息。通常将传感器佩戴在靠近人体重心的腰部位置,以获得更可靠的数据。
一个完整的跌倒事件可分为三个阶段:跌倒前阶段(从失衡开始到撞击瞬间)、跌倒后阶段(撞击后身体状态稳定过程)以及过渡阶段(涵盖整个跌倒过程)。现有研究大多只关注完整的跌倒序列或仅针对跌倒前阶段进行检测。跌倒前检测能在撞击前识别跌倒,为启动如充气安全气囊等保护装置争取宝贵时间,但实现难度极高,需要在极短时间内做出准确预测。此外,大多数研究仅限于二分类(跌倒/非跌倒),忽略了丰富的日常活动(Activities of Daily Living, ADL)类别,限制了系统的实用性和鲁棒性。
为了克服这些局限,来自巴基斯坦国立科学技术大学(NUST)和德国波恩大学医院的研究团队在《IEEE Access》上发表了题为“Beyond Falls: A Hybrid CNN-LSTM-Attention Framework for Pre-, Transition-, and Post-Fall Detection with Wearable Inertial Sensors”的研究论文。该研究提出了一个新颖的深度学习框架,首次将多核扩张卷积神经网络(CNN)、长短期记忆网络(LSTM)和多头自注意力机制(Multi-head Self-Attention)相结合,旨在实现对跌倒所有三个阶段的精准、实时、多类别检测。
本研究主要采用了以下关键技术方法:首先,利用公开的KFall数据集,该数据集包含32名年轻受试者佩戴腰部九轴IMU传感器(采样率100 Hz)记录的21种日常活动(ADL)和15种模拟跌倒类型,共5075条运动记录。针对数据集缺乏跌倒后阶段标注的问题,研究人员设计了一种基于加速度变化率的后处理算法来自动分割跌倒后阶段。模型架构上,采用双分支扩张卷积并行提取多尺度时空特征,接着使用堆叠LSTM层捕捉序列依赖关系,最后通过多头自注意力机制加权重要时间步信息,最终通过全连接层输出36个类别的分类结果。模型使用五折交叉验证进行训练和评估。
在跌倒前阶段检测中,模型取得了平均F1分数98.02%的优异性能,精确率和召回率均约为98%,特异性高达99.85%。这表明模型能有效区分正常日常活动与跌倒前的早期运动。大多数类别(如D01, D05, D12)接近完美性能,但D18和D19(涉及短暂坐立)等少数活动因运动模式模糊而表现稍逊(F1分数约90%),可能与跌倒起始动作相似有关。总体而言,模型在早期预警阶段展现了强大的鲁棒性。
在跌倒后阶段,模型同样表现卓越,平均F1分数为98.19%,特异性达99.93%。模型尤其擅长区分跌倒与躺下或坐下等正常活动。F01、F02、F08等跌倒类别获得近乎完美的分数,表明撞击后的传感器模式非常独特。F11和F12(行走和慢跑中的前向跌倒)因模式相似出现轻微性能下降,D18和D19的混淆依然存在。
过渡阶段结合了前两个阶段的信息,取得了最高的平均F1分数98.61%。模型在绝大多数类别上表现出高精确率和召回率。F06、F08、F12等跌倒类别以及D06、D07等日常活动表现尤为突出,这可能得益于身体剧烈运动中捕获的独特加速度模式。尽管D18和D19仍存在混淆,但相比其他阶段有所改善。
模型在所有三个阶段均保持了约98%的F1分数,过渡阶段整体表现最佳,证明了其无论是用于早期预警还是跌倒后评估都具有高效性。损失和准确率曲线显示模型收敛良好,未见过拟合或欠拟合迹象。
E. COMPARISON WITH EXISTING APPROACHES
与现有方法相比,该研究模型是首个在36类活动设置下,同时对跌倒前、跌倒后和过渡阶段进行评估的方法,并以20毫秒的低推理时间实现了约98%的准确率、灵敏度和F1分数。相比之下,Kiran等人(2024)虽也进行了36类分类,但仅评估了跌倒前阶段。Gangadhar等人(2025)在KFall数据集上使用集成模型进行二分类报告了高灵敏度,但本模型在处理所有三个阶段36个类别的同时,性能还提升了4%。其他许多研究要么忽略某些阶段,要么存在较高的推理延迟(如Sahni等人达1600毫秒),限制了其实用性。
F. TRAINING AND INFERENCE TIME
训练时间因阶段而异:跌倒前和跌倒后模型各需约5.5小时,过渡阶段因数据量更大需约6.5小时。所有三个阶段的推理时间均稳定在20毫秒左右。研究人员还尝试了简化LSTM配置(隐藏单元减至128和64),模型大小减小约72%而准确率仅下降3%,这在模型紧凑性和准确性之间提供了良好平衡,使其非常适合在资源受限的边缘设备上部署。
该研究成功开发了一种基于混合CNN-LSTM-Attention架构的深度学习算法,能够准确、实时地对跌倒的三个阶段(前、后、过渡)进行多类别分类。模型在包含36个类别(15种跌倒,21种ADL)的公开KFall数据集上进行了验证,平均准确率、灵敏度和F1分数均达到98%,推理时间仅为20毫秒,满足了实时部署的要求。通过整合广泛的阶段覆盖、多类别活动识别和低延迟特性,该研究克服了以往研究仅限于二分类、只关注跌倒前分析或受困于高推理延迟的局限性,为实用的跌倒检测系统建立了强有力的基准。
然而,本研究也存在一些局限性。由于真实世界的跌倒数据难以获取,研究依赖于实验室控制环境下收集的模拟跌倒数据,这限制了模型在真实生活场景中性能的验证。此外,与大多数公开数据集一样,KFall数据来自年轻健康参与者,其对于老年人群的普适性仍有待商榷,凸显了对更具代表性、能捕捉真实世界跌倒数据集的迫切需求。未来的工作将侧重于开发并部署该模型的轻量级版本到资源受限的边缘设备上,以实现实际场景中的实时、设备端跌倒检测。这项研究为提升老年人和残疾人的安全与独立生活能力提供了有前景的技术解决方案。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号