编辑推荐:
在医疗领域,天气因素对疾病的影响不容忽视,约 11% 的全球中风负担与天气有关。研究人员开展了利用区域气象数据开发机器学习模型预测急性缺血性脑卒中(AIS)每日入院人数的研究。结果显示 XGB 模型表现最佳,该研究有助于医院规划及疾病预测。
在全球气候危机不断加剧的当下,极端天气频繁出现,这对人类健康的影响愈发显著。中风作为心血管疾病的重要组成部分,严重威胁着人类的生命健康。据统计,约 11% 的全球中风负担与天气因素有关 ,但目前的医疗系统却难以适应因天气变化导致的医疗需求波动。例如,在高温或寒冷天气下,中风的发病率会明显上升,可医院却常常无法提前做好充足的资源准备,导致患者不能得到及时有效的治疗。为了填补这一空白,来自德国海德堡大学曼海姆医学院预防医学与数字健康中心生物医学信息学系等多个机构的研究人员,开展了一项极具意义的研究,该研究成果发表在《npj Digital Medicine》上。
研究人员为了实现利用气象数据预测急性缺血性脑卒中(AIS,是一种因血管血栓形成导致的脑部血液供应障碍性疾病,占所有中风的 60 - 70%)入院人数的目标,运用了多种关键技术方法。首先,他们从德国曼海姆大学医学中心当地的数据集成中心(DIC),获取了 2015 年至 2021 年期间收治的 7914 例 AIS 患者数据。同时,从德国气象局(DWD)的开放数据服务器,收集了覆盖德国的 440 个气象站数据,并通过地理空间匹配,将患者与气象站数据对应起来。其次,在模型构建方面,他们选用了 Poisson 回归、提升广义相加模型(GAM)、支持向量机(SVR)、随机森林(RF)和极端梯度提升(XGB)等模型,并在时间分层的 5×5 折嵌套交叉验证框架下进行评估。
下面来看具体的研究结果:
- 研究队列:研究对象为 7914 例患者(4244 例男性,占 53.6%),平均年龄 71 岁。通过对数据的分析发现,每日 AIS 病例的自相关函数(ACF)和偏自相关函数(PACF)图显示无显著自相关,这表明时间序列数据足够平稳,为后续的模型评估提供了基础。
- 年度和季节趋势:AIS 入院人数在 2015 年显著增加,2018 年和 2020 年有所下降。对 7 年的月度数据进行分析后发现,AIS 入院人数存在明显的季节性变化,3 月、10 月和 11 月为发病高峰期,9 月则有所下降。而每周的平均病例数除了在节假日期间有明显下降外,无明显规律。
- 空间分布:曼海姆大学医学中心位于巴登 - 符腾堡州,研究发现,患者家庭所在地基于邮政编码的地理空间分析显示,贡献最大的前三个区域距离诊所半径小于 11km,占总患者数的 29.2%,约 96.2% 的入院患者来自诊所半径 50km 范围内,这为区域研究方法提供了支持。
- 基线统计模型:Poisson 模型和 GAM 对 AIS 入院人数相关因素进行了分析。Poisson 模型中,滞后 5 天的平均云量、滞后 1 天的平均气压和平均云量与 AIS 入院人数呈负相关;滞后 2 天的最低温度和最大阵风与入院人数呈正相关。GAM 则确定最大气压和平均气压是影响 AIS 入院人数的两个最重要变量。
- 机器学习模型:在测试的机器学习模型中,XGB 表现最佳,其在测试集中的平均绝对误差(MAE)为 1.21 例 / 天,均方根误差(RMSE)为 1.49 例 / 天,相比基线 Poisson 模型,MAE 降低了约 29%,RMSE 降低了 44%。XGB 能有效捕捉每日 AIS 病例数的变化,但在预测低(0 - 1 例)或高(>5 例)AIS 入院天数时存在局限性。
- 基于 XGB 的天气参数变量重要性:XGB 模型中,最大气压(Pmax)是预测每日 AIS 病例入院人数的最重要变量,滞后 3 天的最低温度(Tmin_lag3)次之。通过 SHAP 分析发现,不同气压范围对 AIS 病例数影响不同,低温和高温应激均会增加 AIS 入院人数,风速相关变量也与 AIS 病例数增加有关。
研究结论与讨论部分指出,该研究开发并对比了多种机器学习和统计模型,发现浅层次的机器学习模型在预测 AIS 入院人数方面表现更优,比基线统计模型在 MAE 和 RMSE 指标上提高了 20 - 40%。XGB 模型在实时预测方面具有潜在应用价值,其确定了气压、滞后温度、感知最低温度(PTmin)和风速等是中风发生的重要预测因素。该研究成果为医院实时规划和应对天气相关疾病负担提供了有力支持,通过结合数值天气预报模型或新型深度学习天气预报系统,可实现实时预测,提前预警,为脆弱患者采取预防措施,减少中风风险和入院人数。此外,研究采用的时间分层、嵌套交叉验证框架具有通用性,可应用于多种疾病的多中心研究,但在推广过程中可能面临当地气象数据质量、医疗基础设施差异等挑战。总体而言,该研究为优化医疗资源分配、改善健康公平性提供了新的思路和方法。