890 万住院患者数据构建共病网络:解锁生命健康密码

【字体: 时间:2025年02月06日 来源:Scientific Data 5.8

编辑推荐:

  在医疗数据敏感难获取的背景下,研究人员开展 “Comorbidity Networks From Population-Wide Health Data” 研究,分析 4500 万次住院数据构建共病网络。结果发现疾病关联模式,这有助于疾病预测、患者分类等,为医学研究提供有力支持。

  在当今数字化时代,大量数据为各领域发展注入强大动力,医疗健康领域也不例外。从精准预测疾病风险,到提供个性化医疗服务,海量医疗数据蕴含着巨大潜力。然而,医疗数据的敏感性却像一道坚固的壁垒,阻碍着研究人员对其进行深入探索。一方面,这些数据承载着患者的隐私信息,安全保护至关重要;另一方面,严格的隐私法规和复杂的管理流程,使得研究人员难以获取全面、高质量的医疗数据,这极大地限制了观察性健康数据研究的进展,相应研究结果的可重复性也大打折扣。
与此同时,全球人口老龄化进程不断加速,百岁人生逐渐成为现实,这给医疗系统带来了前所未有的挑战。慢性疾病作为可避免的过早死亡的主要原因,严重威胁着人们的健康。例如心血管疾病、癌症等,不仅给患者带来身心痛苦,还加重了社会医疗负担。因此,利用医疗数据挖掘新知识、改善医疗系统,成为应对这些挑战的关键。在这样的背景下,网络医学(Network Medicine,NM)应运而生,它借助网络理论的原理和方法,试图通过研究疾病之间的相互关联来预防和治疗疾病。共病网络(Comorbidity Networks)作为其中的重要一环,能够展现疾病之间的现象学关系,为揭示慢性疾病的发展模式提供重要线索。

为了突破医疗数据研究的困境,来自奥地利维也纳医科大学复杂系统科学研究所、复杂性科学中心、奥地利供应链情报研究所以及瑞典卡罗林斯卡学院等机构的研究人员 Elma Dervi?、Katharina Ledebur、Stefan Thurner 和 Peter Klimek 开展了一项意义重大的研究。他们的研究成果发表在《Scientific Data》上。

研究人员从奥地利 17 年间 890 万患者的 4500 万次住院记录中提取数据,构建了涵盖不同年龄、性别和观察期的共病网络数据集。为了确保研究的准确性和可靠性,他们使用了一系列专业技术方法。首先,在数据处理方面,利用 Cochran-Mantel-Haenszel(CMH)方法对分层数据进行相关性评估,通过构建二维列联表,计算疾病之间的优势比(Odds Ratio,OR),以此量化疾病之间的关联强度。同时,为了控制年龄、性别和时间等潜在混杂变量的影响,研究人员将数据集按 10 年年龄组和 6 个 2 年时间间隔进行分层分析,仅对每组中患者数量合适(超过 4 人)的列联表计算 OR 值和 p 值,并仅纳入 OR 大于 1.5、p 值小于 0.05 且至少有 100 名患者的共病情况进行研究。此外,研究人员还使用了国际疾病分类第 10 版(ICD-10)的 3 位代码来表示主要和次要诊断,并对数据进行了严格筛选,排除了与疾病无直接关系的诊断代码,如妊娠、分娩、受伤等相关代码。

研究结果丰富且具有深度。在疾病患病率方面,研究发现心血管疾病、癌症和肿瘤在男性和女性中都较为普遍。具体来说,男性中消化系统疾病和精神障碍也较为常见,而女性中肌肉骨骼疾病和消化系统疾病紧随其后。值得注意的是,心血管疾病在男性中一直是最普遍的诊断,在女性中直到 2006 年也是如此,但此后癌症诊断在女性中变得最为普遍。

在共病网络构建方面,研究人员构建了三种不同类型节点的网络,分别是 ICD10 3 位代码、ICD10 Blocks 和慢性疾病。通过对这些网络属性的分析,发现随着患者年龄的增长,网络发生了显著变化。例如,网络中连接节点的数量和平均度(每个节点的平均连接数或边数)增加,这意味着疾病之间的关联更加紧密;平均路径长度缩短,表明网络变得更加密集,疾病之间的相关性增强。同时,中间中心性(Betweenness Centrality)和接近中心性(Closeness Centrality)等指标也呈现出与年龄相关的变化趋势。中间中心性衡量一个节点在连接其他节点中的影响力,研究发现 40 - 49 岁左右,男性和女性网络的中间中心性均值开始增加,这表明在这个年龄段,一些疾病成为连接其他疾病的关键 “桥梁”。接近中心性衡量一个节点到达网络中其他节点的速度,年轻男性在 10 - 19 岁时接近中心性较高,意味着该年龄段少数疾病作为枢纽,使疾病之间连接更为紧密,但随着年龄增长,该值下降,说明随着网络密度增加,单个疾病的影响力逐渐减弱。此外,网络的模块化(Modularity)随着年龄下降,意味着随着个体年龄增长,疾病不太可能形成独立、明显的集群。

综上所述,这项研究通过大规模的数据分析,构建了全面的共病网络数据集,为生命科学和健康医学领域提供了宝贵的资源。研究结果不仅有助于深入理解疾病之间的关联模式,还能为疾病预测、患者分类和个性化医疗提供有力支持。同时,研究人员所使用的方法和得出的结论,也为后续相关研究提供了重要的参考和借鉴,推动了网络医学在医疗健康领域的进一步发展。然而,研究也存在一定局限性,如部分诊断可能因缺乏经济补偿而漏报,数据库缺少门诊就诊、详细社会经济指标和药物信息等。未来的研究可以在此基础上,通过补充其他数据源等方式,进一步完善对共病现象的研究,为改善人类健康做出更大贡献。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号