基于粒子群融合机器学习的高尿酸血症风险预测:仅依赖血常规的创新突破

【字体: 时间:2025年03月15日 来源:BMC Medical Informatics and Decision Making 3.3

编辑推荐:

  研究人员为解决高尿酸血症预测难题,开展基于粒子群融合机器学习的研究,模型准确率达 97.8%,意义重大。

  在健康管理的大舞台上,高尿酸血症正逐渐成为一个不容忽视的 “主角”。近年来,它的发病率持续攀升,而且越来越多的年轻人也被其 “盯上”。高尿酸血症就像一颗隐藏在身体里的定时炸弹,不仅与痛风紧密相关,还是慢性肾病、高血压、心脑血管疾病以及糖尿病等多种疾病的独立危险因素,严重威胁着人类健康。然而,这颗 “炸弹” 在早期却十分 “低调”,没有明显症状,使得患者很难察觉,往往在出现痛风或其他严重并发症时才被发现。
目前,诊断高尿酸血症的传统方法存在诸多弊端。一方面,大规模人群诊断成本高、耗时长;另一方面,现有的风险预测模型也存在问题,大多数模型需要同时使用血常规和生化指标作为输入特征,而生化检测既耗时又昂贵。并且,由于数据质量问题,部分模型准确率较低,还有一些深度学习算法训练的模型资源需求大、能耗高。因此,开发一种更高效、低成本的高尿酸血症风险预测模型迫在眉睫。

杭州师范大学等机构的研究人员勇挑重担,开展了一项极具创新性的研究。他们构建了一种基于粒子群优化(Particle Swarm Optimization,PSO)与机器学习相融合的高尿酸血症风险预测模型,该模型仅依靠常规血常规数据就能准确评估高尿酸血症的风险。研究成果发表在《BMC Medical Informatics and Decision Making》上。

在研究过程中,研究人员用到了多种关键技术方法。首先,数据来源于浙江两个地区医院的体检和疾病记录,包含 26 项血常规特征。针对数据集中的类别不平衡问题,采用基于 SMOTE 的过采样方法进行处理。接着,运用 t 检验和 Cohen's d 值进行单因素分析,筛选出影响高尿酸血症的关键因素,再通过多元逻辑回归进一步确定相关指标。然后,选取逻辑回归(LR)、随机森林(RF)、支持向量机(SVM)、深度神经网络(DNN)和极端梯度提升(XGBoost)这五种机器学习方法作为基线模型,利用 PSO 算法对模型参数进行优化。最后,通过模型集成方法提升预测精度,并引入可解释人工智能(XAI)方法分析特征重要性。

研究结果令人瞩目:

  1. 特征分析:通过 t 检验和 Cohen's d 值分析,发现中性粒细胞百分比(NEUT%)、中性粒细胞绝对值(ANC)、体重(WEIGHT)等多个特征在高尿酸血症组和非高尿酸血症组之间存在显著差异。经过多元逻辑回归分析,确定 LYM、NEUT%、ANC 等指标与高尿酸血症的发生相关。
  2. 模型构建与评估:对五种基线模型进行参数调整和性能评估,结果显示 XGBoost 模型结合 SMOTE 方法在各项指标上表现出色。进一步使用 PSO 算法优化后,该模型的 AUC 达到 0.997,准确率为 0.973。在此基础上,采用 Stacking 和 Voting 两种模型集成方法,其中 Stacking 集成模型的准确率高达 0.978,相比之前的模型有了显著提升。
  3. 模型性能对比:与其他先进模型相比,该研究提出的模型在预测准确率上提高了 11% 以上,展现出明显的优势。
  4. 模型解释性:利用 XGBoost 模型计算特征重要性,结合 SHAP 和 LIME 等 XAI 方法,从不同角度分析了各个特征对模型预测的影响。结果表明,年龄(AGE)、体重(WEIGHT)等特征对模型输出影响较大。
  5. 疾病风险预测平台:研究人员开发了健康画像平台,将风险预测模型集成到平台中。该平台已覆盖杭州临安 65 万常住人口的数据,拥有约 10000 名用户,访问量达 10 万左右,能够实现疾病风险的在线评估和健康管理。

这项研究意义非凡。从临床角度看,其构建的预测模型仅依靠血常规数据,大大降低了检测成本和检测周期,有助于高尿酸血症高危人群的及时诊断和干预,为临床医生提供了有力的辅助诊断工具。从公共卫生角度而言,该模型为大规模人群的高尿酸血症筛查提供了新的技术手段,有助于提高公众对高尿酸血症的认知和防控意识。此外,研究中采用的数据处理和模型优化方法,以及开发的疾病风险预测平台,为其他疾病的风险预测和健康管理提供了宝贵的经验和借鉴。不过,研究也存在一定的局限性,如数据来源有限可能影响模型的普遍性,数据不平衡和合成数据可能存在偏差等。未来,研究人员将继续优化模型,拓展数据来源,提升模型性能,让这一成果更好地服务于人类健康。

婵犵數鍋為崹鍫曞箰閹间緡鏁勯柛顐g贩瑜版帒鐐婇柍瑙勫劤娴滈箖鏌i悢鐓庝喊婵℃彃婀遍埀顒冾潐閹稿摜鈧稈鏅濋埀顒勬涧閵堟悂寮崒鐐村€锋い鎺嶇劍閻﹀酣姊虹拠鎻掝劉缂佸甯″畷婵嬪箳濡も偓缁€澶愭煟閺冨倸甯舵潻婵囩節閻㈤潧孝婵炶尙濞€瀹曟垿骞橀幇浣瑰兊閻庤娲栧ú銊╂偩閾忓湱纾介柛灞剧懅椤︼附淇婇锝囩煉鐎规洘娲熼、鏃堝川椤栵絾绁梻浣瑰缁诲倿鎮ч幘婢勭喓鈧綆鍠楅悡娆愮箾閼奸鍤欐鐐达耿閺屾洟宕堕妸銉ユ懙閻庢鍣崜鐔肩嵁瀹ュ鏁婇柣锝呮湰濞堟悂姊绘担钘変汗闁烩剝妫冨畷褰掓惞椤愶絾鐝烽梺绉嗗嫷娈曟い銉ョ墦閺屾盯骞橀懠顒夋М婵炲濯崹鍫曞蓟閺囥垹骞㈡俊銈咃工閸撻亶鏌i姀鈺佺仭濠㈢懓妫楀嵄闁圭増婢橀~鍛存煟濞嗗苯浜惧┑鐐茬湴閸婃洟婀侀梺鎸庣箓濡瑧绮堢€n喗鐓冪憸婊堝礈濮橆厾鈹嶉柧蹇氼潐瀹曟煡鏌涢幇銊︽珖妞も晝鍏橀弻銊モ攽閸℃瑥鈪靛┑鈽嗗灠椤戝寮诲☉銏犵闁瑰鍎愬Λ锟犳⒑鐠囧弶鍞夊┑顔哄€楃划姘舵焼瀹ュ懐顦ㄥ銈嗘尵婵兘顢欓幒妤佲拺閻犲洠鈧櫕鐏侀梺鍛婃煥妤犳悂鍩㈤幘璇茬闁挎棁妫勫▓銉ヮ渻閵堝棛澧紒顔肩焸閸╂盯寮介鐔哄幈濠电偛妫欓崝鏇㈡倶閳哄偆娈介柣鎰级閸犳﹢鏌熼姘毙х€殿噮鍣e畷鎺懳旀担瑙勭彃

10x Genomics闂傚倷绀侀幖顐﹀磹閻熼偊鐔嗘慨妞诲亾妤犵偞鐗犻垾鏂裤€掓刊鐖剈m HD 闂佽瀛╅鏍窗閹烘纾婚柟鍓х帛閻撴洘鎱ㄥΟ鐓庡付闁诲繒濮烽埀顒冾潐濞叉粓宕伴幘鑸殿潟闁圭儤顨呴獮銏℃叏濮楀棗澧┑顔煎暣濮婃椽宕ㄦ繝鍌滅懆濠碘槅鍋呯划宥夊Φ閺冨牆绠瑰ù锝囨嚀娴犮垽姊洪幖鐐插姉闁哄懏绮撻幃楣冩焼瀹ュ棛鍘遍棅顐㈡搐椤戝懏鎱ㄩ埀顒€鈹戦悙瀛樼稇婵☆偅绮撴俊鐢稿箛閺夊灝宓嗛梺缁樶缚閺佹悂鎮℃担铏圭=濞达絽鎲″﹢鐗堜繆閻愯埖顥夐摶鐐烘煕瑜庨〃鍛矆閸℃稒鐓曢柍鈺佸暈缂傛岸鏌嶈閸忔稓鍒掑▎鎾虫瀬鐎广儱顦伴弲鎼佹煥閻曞倹瀚�

濠电姷鏁搁崑娑樜涙惔銊ュ瀭闁兼祴鏅滃畷鏌ユ倵閿濆骸浜為柍缁樻閹鏁愭惔鈥崇缂備椒鑳跺▍澧俰st闂傚倷绶氬ḿ褍螞濡ゅ懏鏅濋柨婵嗘川缁犳柨顭块懜闈涘婵☆偅蓱閵囧嫰骞樼捄杞扮捕缂傚倸绉崇欢姘跺蓟濞戙垹鍐€闁靛ě鍐f嫛婵犵數鍋涢悧濠囧储椤ョSPR缂傚倸鍊烽悞锔剧矙閹烘鍎庢い鏍仜閻掑灚銇勯幒鍡椾壕濡炪倧缂氶崡鎶藉箖瑜斿畷顐﹀Ψ閵堝棗濯伴梻渚€鈧偛鑻晶鏉戔攽閳ユ剚鍤熼柍褜鍓ㄧ紞鍡涘礈濮樿泛姹查柍鍝勬噺閸婂灚绻涢幋鐐垫噧濠殿喖鍟撮弻娑㈠籍閹炬潙顏�

闂傚倷绀侀幉锟犮€冮崱妞曞搫饪伴崨顓炵亰闂婎偄娲︾粙鎺楀吹閸曨垱鐓熼柟閭﹀墻閸ょ喖鏌曢崼鐔稿唉妤犵偞鐗犲鍫曞箣閻樻鍞堕梻浣告啞閻熴儱螞濠靛棭娼栧┑鐘宠壘鎯熼梺闈涱檧缁茬厧霉閻戣姤鐓熼柣妯夸含閸斿秶鎲搁弶鍨殻闁诡喓鍎甸弫鎾绘晸閿燂拷 - 濠电姷鏁搁崕鎴犲緤閽樺鏆︽い鎺戝閻鏌涢埄鍐$細妞も晜鐓¢弻娑㈠焺閸愭儳姣€闂佸湱鍎ら幐楣冦€呴悜钘夌閺夊牆澧界粔鐢告煕鎼淬垹鐏ラ柍钘夘樀楠炴﹢顢涘顐㈩棜婵犵數鍋為崹鍫曞箹閳哄倻顩叉繝濠傚暟閺嗭箓鏌i弮鍥仩缁炬儳銈搁弻娑㈠焺閸愵厼顥濋梺鍛婃⒐鐢繝骞冨Δ鍛嵍妞ゆ挾鍋樺Σ鎰版⒑缂佹ḿ鈯曢柣鐔濆洤绠悗锝庡枛缁犳煡鏌熸导瀛樻锭闁诡喕绶氬娲川婵犲倻顑傛繝鈷€鍕垫疁鐎殿喗濞婇幃銏ゆ偂鎼达綆鍞规俊鐐€栭弻銊╂倶濠靛牏鐜绘繛鎴欏灪閻撴瑩鎮归妸銉Ц闁稿﹤顭烽幃鐑藉閵堝棛鍘卞┑鐐叉閿氶柣蹇嬪劜閵囧嫰顢曢姀鈺佸壎閻庤娲滄繛鈧€殿喕绮欓、鏍敃閿濆懏璇為悗娈垮枟閹倿寮幘缁樻櫢闁跨噦鎷�

婵犵數鍋為崹鍫曞箰閹间緡鏁勯柛顐g贩瑜版帒鐐婃い鎺嗗亾鏉╂繃绻濋悽闈浶㈤悗姘煎櫍閹本鎯旈妸锔惧幘閻庤娲栧ú銈嗙濠婂牊鐓曢柣鎰摠鐏忥箓鏌熼挊澶娾偓濠氬焵椤掑﹦绉甸柛鎾村哺椤㈡棃濡舵径瀣化闂佽澹嬮弲娑欎繆閾忓湱纾奸柕濞у喚鏆梺鐟板槻閹冲酣銈导鏉戠闁靛ě鈧崑鎾寸節濮橆厾鍘搁柣搴秵閸嬪嫭鎱ㄩ崼銉︾厸鐎光偓閳ь剟宕版惔銊ョ厺闁哄啫鐗嗛崡鎶芥煟濡寧鐝慨锝呭閺岋絾鎯旈姀鈶╁闂佸憡姊圭敮鈥崇暦濠靛鍋勯柣鎾冲閵夆晜鐓ラ柣鏇炲€圭€氾拷

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号