编辑推荐:
为探究中老年人抑郁风险因素,江西财经大学研究人员运用 “LSTM + ML” 两步混合模型分析 CHARLS 数据。结果显示该模型能有效预测抑郁,关键因素有残疾、生活满意度等。这有助于早期诊断和干预,对提升中老年人健康意义重大。
在全球老龄化浪潮下,抑郁症已成为中老年人健康的重大威胁。据统计,全球约 3.11 亿人被诊断患有抑郁症,中国保守估计抑郁症患者超 5400 万,60 岁及以上人群发病率达 22.7%,且超 90% 患者未及时规范治疗。目前抑郁症预测研究存在诸多问题,如生物指标虽诊断准确但难以预测未来风险,横断面统计数据无法精准预估,基于社交媒体的分析方法适用性有限,传统研究方法多局限于线性关系,难以捕捉风险因素的动态变化。为解决这些问题,江西财经大学的研究人员开展了一项关于预测中老年人抑郁症及解析其异质性影响的研究,该研究成果发表于《BMC Psychology》。
研究人员利用中国健康与养老追踪调查(CHARLS)的大样本数据,采用 “LSTM + ML” 两步混合模型进行研究。首先,运用长短期记忆网络(LSTM),通过前四波数据预测第五波(2020 年)的特征值,利用其记忆细胞和门控机制捕捉时间序列信息,有效学习健康、心理和社会特征的动态变化模式。随后,使用逻辑回归(LR)、随机森林(RF)、极端梯度提升(XGBoost)、支持向量机(SVM)和卷积神经网络(CNN)这五种常见机器学习(ML)方法,基于 LSTM 预测的特征对 2020 年的抑郁状态进行分类。
在预测能力方面,LSTM 模型表现出色,验证集训练曲线的均方误差(MSE)稳定在 0.067。多种评估指标显示,CNN 模型在预测抑郁症状发展方面整体性能最优,其准确率达 76.4%,敏感度为 58.1%,阳性预测值(PPV)为 72.2%,Brier 得分为 0.161,受试者工作特征曲线下面积(AUC)为 0.804。
通过 SHAP 方法分析发现,残疾、生活满意度、日常生活活动能力(ADL)受损、自评健康状况和自我报告的记忆力是影响中老年人抑郁的五大关键预测因素。残疾限制了中老年人的日常功能,增加生活挑战,导致社交活动减少、孤独感上升,影响自我认同,进而易引发抑郁;生活满意度受退休等因素影响,社会和生活角色的变化会带来心理负担,降低生活质量和满意度;ADL 受损会使老年人在日常活动中感到能力不足或依赖他人,降低自尊,增加心理负担;自评健康状况差不仅反映身体功能受损,还会引发对疾病后果的担忧和情绪困扰,加重抑郁症状;自我报告的记忆力同样在抑郁预测中发挥重要作用。
进一步比较发现,CNN 和 RF 模型在特征重要性上存在差异。CNN 通过卷积层学习局部模式,捕捉复杂高阶特征交互,其 SHAP 重要性常集中于少数关键变量;RF 基于决策树结构,SHAP 计算依赖特征对决策树分裂过程的贡献,更强调单个特征对模型决策的独立影响。
研究还发现,中老年人抑郁预测的重要因素存在差异。中年组前三大预测因素为残疾、生活满意度和慢性病;老年组则是生活满意度、慢性病和 ADL 受损。这是因为中年时工作和家庭责任重,残疾对工作和生活影响大,易增加心理压力;老年人群更注重整体生活满意度,且更易患慢性病,这些疾病影响身体健康,增加生活压力,降低生活质量,提升抑郁风险。
综上所述,该研究构建的 “LSTM + ML” 模型成功捕捉了中老年人抑郁风险因素的高维及时间序列信息,揭示了中老年人抑郁风险因素的差异。这一成果对医生、护士和社区医疗服务人员等进行抑郁症的早期检测和干预具有重要价值,为制定针对性的预防和干预措施提供了科学依据,有助于提升中老年人的心理健康水平和生活质量。同时,研究也为后续进一步深入研究抑郁症的发病机制和防治策略奠定了基础。