基于无监督机器学习技术预测印度泰米尔纳德邦库姆巴科纳姆地区心血管疾病风险因素的高效策略

【字体: 时间:2025年02月14日 来源:Scientific Reports 3.8

编辑推荐:

  心血管疾病(CVD)是全球主要死因,早期诊断对治疗意义重大。研究人员收集印度泰米尔纳德邦库姆巴科纳姆地区患者数据,运用多种聚类算法和主成分分析(PCA)开展研究。结果发现数据集聚类效果良好,总胆固醇在风险预测中作用关键。该研究为 CVD 风险预测提供新方法312。

  在当今社会,人们的健康面临着诸多挑战,心血管疾病(CVD)更是成为威胁人类生命的 “头号杀手”。据统计,2021 年有 2050 万人死于心血管疾病。而且,心血管疾病在不同收入国家的死亡率差异明显,高收入国家(HICs)死亡率下降较快,而低和中等收入国家(LMICs)却负担着全球 80% 以上的 CVD 死亡病例3
以往,由于技术发展的限制,心血管疾病的诊断往往存在延迟,进而导致治疗延误,许多生命因此消逝。即便人们现在会定期进行体检并服用药物,但心血管疾病依旧严重威胁着人类的生命健康。而且,其致病原因复杂,涉及环境、行为等多种因素。因此,提前预测心血管疾病的风险因素,并提供精准的治疗方案,成为了医学领域亟待解决的重大问题。

在这样的背景下,来自 SASTRA Deemed to be University(印度泰米尔纳德邦库姆巴科纳姆)的研究人员 K Kannan 和 A Menaga 开展了一项重要研究。他们收集了印度泰米尔纳德邦库姆巴科纳姆及其周边地区四个不同实验室的 130 名患者的数据,运用无监督机器学习技术,深入探索心血管疾病风险因素的预测方法。研究成果发表在《Scientific Reports》上,为心血管疾病的防治提供了新的思路和方法12

研究人员在此次研究中主要运用了以下关键技术方法:

  • 数据收集:从当地知名实验室获取 130 名患者的信息,涵盖性别、血糖、血脂等 12 项特征。
  • 聚类算法:采用 k - 均值聚类、围绕中心点划分(PAM)聚类、层次聚类和模糊聚类等方法,分析患者数据的聚类特征。
  • 主成分分析(PCA):用于特征选择,确定影响风险因素的主要参数。

下面将详细介绍研究的具体结果:

  • 数据相关性分析:研究人员首先对收集到的数据进行相关性分析。发现诸如血糖餐后 2 小时(Sugar PP)与空腹血糖(Sugar Fasting)、肌酐(Creatinine)与尿素(Urea)、低密度脂蛋白胆固醇(L.D.L. cholesterol)与总胆固醇(Total Cholesterol)、极低密度脂蛋白胆固醇(V.L.D.L. cholesterol)与甘油三酯(Triglycerides)之间存在显著相关性。基于此,在后续分析中排除了部分相关性过高的指标456
  • 异常值与聚类能力检测:运用四分位距统计(IQR)检测数据集中的异常值,发现 “血红蛋白(Blood Haemoglobin)”“总胆固醇”“甘油三酯”“空腹血糖” 和 “尿素” 等特征存在异常值。通过霍普金斯统计(Hopkins statistic)检验数据集的聚类能力,结果表明该数据集适合进行聚类分析7
  • 聚类算法结果:分别运用 k - 均值聚类、PAM 聚类、层次聚类和模糊聚类算法对数据集进行分析。通过轮廓系数(Silhouette statistic)确定各类算法的最优聚类数均为 2。研究发现,k - 均值聚类和 PAM 聚类在皮尔逊系数和欧氏距离度量下,聚类大小、平均轮廓宽度和效率结果相近;层次聚类中,凝聚式和分裂式聚类各有特点,且数据集呈现出较强的聚类结构;模糊聚类中,当隶属度指数为 1.7 和 2 时,轮廓值最高89
  • 主成分分析结果:对所有 11 个参数进行主成分分析,分别基于协方差矩阵和相关矩阵计算。结果显示,基于协方差矩阵,前两个主成分可解释 75.24% 的总方差,前三个主成分可解释 95.90% 的总方差;基于相关矩阵,前四个主成分可解释 74.12% 的总方差,且总胆固醇与第一个主成分呈高度正相关,表明其在风险预测中起重要作用1011

在研究结论和讨论部分,研究人员指出,通过多种聚类算法的应用,发现 k - 均值聚类和 PAM 聚类在特定条件下结果相似,且数据集具有良好的聚类结构和稳定性。模糊聚类在特定隶属度指数下能获得较高轮廓值。主成分分析则确定了总胆固醇是心血管疾病风险预测的关键因素。

这项研究的重要意义在于,为心血管疾病风险因素的预测提供了一种基于无监督机器学习技术的高效方法。研究结果有助于早期识别心血管疾病的高风险人群,从而实现更有针对性的预防和治疗,对降低心血管疾病的死亡率具有重要的潜在价值。同时,研究人员也提出,未来可进一步探索基于模型的聚类方法、人工神经网络和结构方程建模技术在风险预测中的应用,为心血管疾病的研究和防治开辟更广阔的道路。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号