编辑推荐:
为解决 NMA 治疗排序未考虑 MID 的问题,研究人员提出 MID 调整的排序指标,该指标有临床意义。
在医学研究的 “大舞台” 上,网络荟萃分析(Network Meta-Analysis,NMA)是比较多种治疗方法相对效果的常用 “利器”。想象一下,面对众多治疗同一种疾病的方法,医生和患者都渴望知道哪种才是真正的 “佼佼者”,NMA 就可以通过综合分析多项研究,给出各种治疗方法的排名和效果对比。然而,目前的 NMA 在计算排名指标时,却存在一个 “小漏洞”:常常忽略治疗效果之间差异的大小。像概率最佳值、累积排名曲线下面积(Surface Under the Cumulative Ranking Curve,SUCRA)这些常见的排名指标,没有考虑到最小重要差异(Minimally Important Differences,MID)。MID 是指患者或临床医生认为在治疗效果上有意义的最小差异值,比如对于 2 型糖尿病患者,血红蛋白 A1c(HbA1c,反映过去 2 - 3 个月平均血糖水平的指标)治疗组间 0.3% 的差异就被认为具有临床意义。但这个关键因素在 NMA 排名指标计算中却未被重视,导致排名结果可能无法反映出真正有临床意义的差异,就好比一场比赛,没有考虑到选手之间关键的差距,这样的排名显然不能准确反映选手的真实水平。
为了解决这个问题,来自 Costello Medical、University of Waterloo 等机构的研究人员 Tristan Curteis、Augustine Wigle 等人展开了深入研究。他们的研究成果发表在《BMC Medical Research Methodology》上,为 NMA 治疗排序带来了新的突破。
研究人员采用的主要技术方法包括:首先,通过明确定义排名函数来构建常见的排名指标,进而延伸出 MID 调整后的排名指标;在处理排名中的平局问题时,采用中点法,以确保调整后的 SUCRA 值等指标具有良好的性质;利用 R 语言开发了 mid.nma.rank 包,基于贝叶斯框架实现了 MID 调整排名指标的计算,这一工具为后续研究提供了便利。
在研究结果部分:
- MID 调整排名指标的定义:研究人员定义了一系列 MID 调整后的排名指标,如 MID 调整的中位数排名、MID 调整的第 j 最佳概率、MID 调整的累积第 j 最佳概率和 MID 调整的 SUCRA 值。这些指标通过考虑 MID,改变了传统排名函数的计算方式,使得排名更能反映临床实际情况。例如,MID 调整的排名函数中,只有当治疗效果差异大于或等于 MID 时,才会认为一种治疗优于另一种治疗12。
- 帕金森病案例分析:研究人员重新分析了帕金森病治疗的数据集,该数据集包含 7 项研究、5 种治疗方法,以 “关” 期时间(即药物剂量之间症状复发的潜伏期)的平均减少量为研究指标。研究设定 1 小时为 MID,结果发现,考虑 MID 后,卡麦角林、溴隐亭和罗匹尼罗在中位数排名上与安慰剂相比并无优势,只有普拉克索与安慰剂相比有临床相关的治疗效果。而不考虑 MID 时,可能会错误地认为每种治疗都有不同的排名,且差异具有临床意义。此外,随着 MID 增加,卡麦角林、溴隐亭、罗匹尼罗和安慰剂的 SUCRA 值更接近,而普拉克索的 SUCRA 值仍接近 1,这表明普拉克索在考虑 MID 后仍优于其他药物34。
- 糖尿病案例分析:对于糖尿病研究,研究人员使用了包含 26 项研究、10 种治疗方法(包括安慰剂)的数据集,以糖化血红蛋白(HbA1c)基线变化的平均差异为研究指标,设定 0.3% 为 MID。结果显示,调整 MID 前后的排名指标相当相似,说明该数据集的排名指标对 MID 调整具有一定的稳健性56。
在研究结论与讨论部分,研究表明,不考虑 MID 会导致 NMA 治疗排名缺乏临床相关性,而新提出的 MID 调整的贝叶斯排名指标很好地解决了这一问题。使用中点法处理平局,保证了 MID 调整的 SUCRA 值平均为 0.5,与传统 SUCRA 值具有可比性,便于理解和分析。虽然 MID 调整的 P 分数和 SUCRA 值在计算和解释上存在差异,但在治疗相对位置的比较上具有相似的结论。此外,研究人员还指出,MID 的选择存在一定主观性,未来可探索混合方法,如先基于 MID 识别与安慰剂差异小于 MID 的治疗子集,再对差异大于 MID 的治疗采用标准排名方法。
总的来说,这项研究将 MID 整合到 NMA 排名指标中,是对现有方法的重要改进,提高了 NMA 结果的临床可解释性。通过考虑临床相关差异,能够创建更有用、更易理解的治疗排名,为临床决策提供更可靠的依据。其开发的贝叶斯软件包也有助于推动该方法在医学研究和临床实践中的广泛应用,让医生和患者在面对多种治疗选择时,能更科学地做出决策。