递归梯度扫描法:优化临床研究中连续预测变量离散化的新突破

【字体: 时间:2025年03月13日 来源:BMC Medical Research Methodology 3.9

编辑推荐:

  研究人员为解决连续预测变量离散化问题,开展 RGS 方法研究,结果显示其优于传统方法,意义重大。

  在临床和流行病学研究的广阔领域中,探究连续暴露或协变量与疾病结局之间的关联,就像解开一道道神秘的谜题,对疾病风险预测和治疗策略制定起着举足轻重的作用。近年来,越来越多的研究发现,在医学领域存在许多 U 型剂量 - 反应关系。比如体重与虚弱程度、体重和腰高比与抑郁、蛋白质摄入与肌肉增长,还有血尿酸含量与死亡风险、慢性肾病风险等,都呈现出 U 型模式。这意味着无论是过高还是过低的相关因素水平,都可能对健康产生不利影响,只有适度水平才有利于健康。
然而,在研究这些关系时,一个关键问题却常常被忽视,那就是离散化方法的选择。传统上,研究人员在处理连续预测变量时,往往采用简单分类的方式,比如依据参考范围或者数据分布将其分类。但这种方法饱受诟病,它可能会引入偏差,还会丢失变量连续性所蕴含的宝贵信息。另外,由于阳性结果存在差异,数据所确定的最佳切点也会有所不同。虽然统计学家们普遍认为,当潜在趋势复杂时,将变量视为连续变量,采用非参数或样条回归更为合适,可这些方法要么应用起来复杂,要么解释起来困难,导致在流行病学研究中,分类数据仍然被广泛使用。而连续预测变量在模型开发过程中的离散化方式,会直接影响对个体疾病的预测,进而影响后续的治疗策略和预后。因此,如何合理地离散化连续预测变量,成为了构建可靠模型、提供准确预测的关键所在。

为了解开这一难题,来自中山大学公共卫生学院的研究人员展开了深入研究。他们提出了一种名为递归梯度扫描法(Recursive Gradient Scanning Method,RGS)的全新方法,专门用于离散化多个与自然对数优势比(lnOR)呈 U 型关系的连续变量,并将研究成果发表在《BMC Medical Research Methodology》上。这一研究成果意义非凡,为医学研究和临床实践提供了重要的新工具和新方法。

研究人员在开展这项研究时,运用了多种关键技术方法。首先,他们利用样条技术来检测变量之间的 U 型关系,这就像是给研究装上了一双 “慧眼”,能够精准识别出复杂的非线性关系。接着,使用扫描方法进行离散化处理,把研究对象合理地分类为低暴露组和高暴露组。在确定最佳切点的过程中,充分考虑 lnOR 或 lnHR(风险比的自然对数)的影响,通过一系列算法和迭代过程,寻找具有相似 log (η) 值的两个切点,以此实现更精准的分类。同时,借助 R 语言中的多个软件包,如 “CutpointsOEHR”“TCPMOR”“SemiPar”“maxstat” 等,辅助完成各种统计分析和模型构建工作。此外,还使用了蒙特卡罗模拟研究,模拟不同的现实场景,全面评估 RGS 方法的性能,并与其他传统离散化方法进行对比。研究数据来源广泛,其中包括美国疾病控制与预防中心进行的行为风险因素监测系统(BRFSS)调查数据,这些数据为研究提供了坚实的基础。

下面来看具体的研究结果:

  • 模拟研究结果:研究人员通过设置不同的场景,包括不同的相关水平、样本大小、缺失率以及 U 型曲线的对称性,对 RGS 方法与其他四种传统离散化方法(中位数法、Q1-Q3法、最小 p 值法和最大优势比双切点法)进行了全面比较。结果令人惊喜,在所有模拟场景中,RGS 方法都展现出了卓越的性能。随着相关性增加,虽然所有方法的 AIC(赤池信息准则)值上升、AUC(受试者工作特征曲线下面积)值下降,但 RGS 方法在各相关性水平下,AIC 值最低、AUC 值最高;随着样本量增加,所有离散化方法的 AIC 和 AUC 值都有所上升,RGS 方法依然保持着更低的 AIC 值和更高的 AUC 值;在处理缺失数据方面,无论缺失率如何变化,RGS 方法在不同的缺失数据机制下,都表现出色,AIC 值最小,AUC 值最高,充分证明了其在复杂数据情况下的可靠性。另外,在不同对称性程度的 U 型曲线场景中,RGS 方法同样优势明显,随着对称性降低,虽然所有方法的 AIC 值增加、AUC 值降低,但 RGS 方法始终表现最佳。
  • 实际数据集应用结果:研究人员将 RGS 方法应用于 BRFSS 调查数据,对每月运动频率和每周运动代谢当量(METs)与抑郁之间的关系进行研究。结果发现,使用 RGS 方法确定的最佳切点,在区分能力和整体性能方面,都优于原始切点。例如,当每月运动频率在 12.6 - 26.5 次左右、每周 METs 在 610.9 - 2203.7 之间时,与更好的心理健康状况相关。从模型评估指标来看,RGS 方法在 AUC、AIC 和调整后的 R2等方面,都显著优于其他传统离散化方法,再次验证了其在实际应用中的有效性。

综合研究结论和讨论部分,递归梯度扫描法(RGS)在处理多个与 lnOR 呈 U 型关系的连续预测变量离散化问题上,展现出了强大的优势,无论是在模型拟合优度还是预测能力方面,都超越了传统离散化方法。它通过迭代优化切点,有效提升了模型的性能,为医学研究中的复杂数据处理提供了一种可靠的解决方案。虽然该方法在应用过程中可能存在一些小问题,比如存在局部最优解的风险,计算效率相对较低,但总体而言,其优势远远超过了这些不足。而且,研究人员还在不断努力,未来计划针对这些局限性进行改进,并进一步拓展 RGS 方法在更复杂场景中的应用,如涉及多个预测变量或多样关系的情况。同时,研究人员也期待医学领域的同行们能够运用这一方法分析研究数据,共同推动该方法的发展和完善,为医学研究和临床实践带来更多的突破和进步。

婵炴垶鎸搁鍫澝归崶鈹惧亾閻熼偊妲圭€规挸瀛╃€靛ジ鏁傞悙顒佹瘎闁诲孩绋掗崝鎺楀礉閻旂厧违濠电姴娲犻崑鎾愁潩瀹曞洨鐣虹紓鍌欑濡粓宕曢鍛浄闁挎繂鐗撳Ο瀣煙濞茶骞橀柕鍥ㄥ哺瀵剟骞嶉鐣屾殸闂佽偐鐡旈崹铏櫠閸ф顥堥柛鎾茬娴狀垶鏌曢崱妤婂剱閻㈩垱澹嗗Σ鎰板閻欌偓濞层倕霉閿濆棙绀嬮柍褜鍓氭穱铏规崲閸愨晝顩烽柨婵嗙墦濡鏌涢幒鎴烆棡闁诲氦濮ょ粚閬嶅礃椤撶姷顔掗梺璇″枔閸斿骸鈻撻幋锔藉殥妞ゆ牗绮岄埛鏍煕濞嗘劕鐏╂鐐叉喘閹秹寮崒妤佹櫃

10x Genomics闂佸搫鍊瑰姗€骞栭—娓媠ium HD 閻庢鍠掗崑鎾绘煕濮樼厧鐏犵€规洜鍠撶槐鎺楀幢濮橆剙濮冮梺鍛婂笒濡粍銇旈幖浣瑰仢闁搞儮鏅滈悾閬嶆煕韫囧濮€婵炴潙妫滈妵鎰板即閻樼數鐓佺紓浣告湰濡炶棄螞閸ф绀嗛柛鈩冡缚閳ь兛绮欓弫宥夋晸閿燂拷

濠电偛妫庨崹鑲╂崲鐎n偆鈻旈悗锝庡幗缁佺櫉wist闂侀潧妫楅敃锝囩箔婢舵劕妫樻い鎾跺仜缂嶄線鏌涢弽銊у⒈婵炲牊鍘ISPR缂備焦绋掗惄顖炲焵椤掆偓椤︿即鎮ч崫銉ゆ勃闁逞屽墴婵″鈧綆鍓氶弳鈺呮倵濞戞瑥濮冮柛鏃撴嫹

闂佸憡顨嗗ú婊呭垝韫囨稒鍤勯柣鎰嚟閵堟挳骞栭弶鎴犵闁告瑥妫濆濠氬Ω閵夛絼娴烽柣鐘辩劍瑜板啴鎮ラ敓锟� - 濠电儑绲藉畷顒勫矗閸℃ḿ顩查柛鈩冾嚧閹烘挾顩烽幖杈剧秵閸庢垵鈽夐幘顖氫壕婵炴垶鎼╂禍婊冪暦閻旇櫣纾奸柛鈩冭壘閸旀帡鎮楅崷顓炰槐闁绘稒鐟ч幏瀣箲閹伴潧鎮侀梺鍛婂笧婢ф寮抽悢鐓庣妞ゆ柨鐏濈粣娑㈡煙鐠ㄥ鍊婚悷銏ゆ煕濞嗘ê鐏ユい顐㈩儔瀹曠娀寮介顐e浮瀵悂鏁撻敓锟�

婵炴垶鎸搁鍫澝归崶顒€违濠电姴瀚惌搴ㄦ煠瀹曞洤浠滈柛鐐存尦閹藉倻鈧綆鍓氶銈夋偣閹扳晛濡虹紒銊у閹峰懎饪伴崘銊р偓濠氭煛鐎n偄濮堥柡宀€鍠庨埢鏃堝即閻樿櫕姣勯柣搴㈢⊕閸旀帡宕濋悢鐓幬ラ柨鐕傛嫹

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号