《Journal of Clinical Anesthesia》:Comparing multiple people each to the grand mean of log-normally distributed endpoints
编辑推荐:
麻醉相关任务时间比较的统计方法研究。通过蒙特卡洛模拟和多种统计模型比较,发现固定效应模型结合Bonferroni校正和稳健方差估计适用于样本量较大的情况(100+病例/人),而小样本时广义pivot推断与Sidak校正更准确。重点分析了不同方法在多重比较中的Type I错误控制效果。
陈培富|弗兰克林·德克斯特
爱荷华大学麻醉学系,6 JCP,爱荷华城,IA 52242,美国
摘要
背景
许多麻醉学指标遵循对数正态分布,包括手术时间、麻醉时间、硬膜外置入时间、拔管时间和术后监护室停留时间。这些指标可以在不同人员(如麻醉师或外科医生)、医院或临床试验中心之间进行比较,以检测异常值。我们考虑将每个组(以下简称“个体”)与总体平均值进行比较。
方法
通过蒙特卡洛模拟,使用广义线性模型、广义枢轴方法和混合效应模型(结合经验贝叶斯均值和从随机效应预测的标准误差)来评估误检风险(第一类错误)。模型在考虑和不考虑异方差一致性(稳健)标准误差的情况下进行了评估。
结果
当固定效应模型缺乏用于多重比较的Bonferroni校正时,误差高达10倍。由于所进行的比较在统计上并不独立,?idák校正的增量不准确性较小。稳健方差估计比默认的观测信息矩阵方法更准确。然而,每人10例的样本量对于稳健方差方法来说太小,导致较大的不准确性。即使每人有60例的中位数,使用Bonferroni校正、稳健方差估计和对数链接时,误差仍然较大。当使用混合效应模型(即收缩估计)时,Bonferroni校正仍会导致高度不准确的结果。未经校正时,误差为轻微到中等。对于每个个体与总体平均值进行比较时,应用广义枢轴推断并使用?idák校正,误差非常小。
结论
对于对数正态分布的连续结果,当每人样本量达到数百例时,建议使用带有Bonferroni校正和稳健方差估计的固定效应模型。否则,我们推荐使用带有?idák校正的广义枢轴推断。
引言
与麻醉学相关的多个指标遵循对数正态分布,包括手术时间、[1]、[2]、[3]、[4]、[5]、[6]、[7]、[8]、[9]、[10]、[11]、[12]、[13]、[14]、[15]、[16]、[17]、[18]、[19]、[20]、[21]、[22]、[23]麻醉时间、[4,5]硬膜外置入时间[6]、拔管时间[7,8]以及术后监护室停留时间[9,10]。通常需要在不同人员(如麻醉师或外科医生)[1]、医院[5,11]或临床试验中心[12]之间进行比较,以检测异常值。从统计学角度来看,每个组(以下简称“个体”)都与总体平均值[5,12]进行比较。这是美国一些保险公司最近在根据平均时间(即总体平均值)[5]支付麻醉从业者费用时感兴趣的数学问题。然而,哪种统计方法最能准确控制误检风险尚不清楚。[13] 最近(2023年)才发布了针对正态分布的适当第一类和第二类错误率的模拟结果[12],但对于与麻醉学相关的对数正态分布来说,这些结果尚未得出。此前,广义枢轴推断被用于研究医院间麻醉持续时间的不平等性,但由于15年前计算上的不切实际,没有评估第一类错误率[4,5,[14], [15], [16], [17]]。在本研究中,我们评估了广义线性模型和混合效应模型的准确性,因为这些技术可以使用Stata、SAS、R等软件通过两到五行代码实现。我们将它们的性能与广义枢轴推断(针对对数正态数据的精确方法[14], [15], [16],由我们编写[4,5,16,18])进行了比较,并提供了结果。我们检查了单侧P值,因为我们的目标是识别手术和麻醉时间超过平均水平的人员、医院、中心或组[5]。这些问题不是患者安全问题,而是管理和财务问题,因此我们旨在防止错误识别。
部分摘录
每个个体的模拟变异性及病例数量
模拟了均值为2小时、变异系数为0.30的正态和对数正态分布。后者的选择基于对报告手术室时间变异系数的研究的综述[5]。在这种适当的变异系数下,每个个体(例如外科医生或麻醉师)的模拟持续时间具有围绕其中心矩的随机变异性。每人30例的样本量属于中等规模,这在医院中是典型的
结果
无论数据遵循正态分布还是对数正态分布,当固定效应模型缺乏多重比较校正时,结果都非常不准确(图1)。表1的第14至18行和表2的第19至28行显示,误差超过10倍。Bonferroni校正和?idák校正之间的成对比较分别显示在表1的第1行与第4行、第2行与第5行,以及表2的第2行与第3行、第5行与第6行、第7行与第8行、第9行与第10行和第16行与第17行之间。所有?idák校正
讨论
我们比较了用于识别麻醉或手术任务耗时超过平均水平的个体、医院、中心或组的统计方法。使用固定效应方法时,如果没有进行多重比较校正,结果非常不准确(表1)。广义线性建模、多元回归等方法不会自动调整系数。在进行30次比较时,使用Bonferroni校正可以得到正确结果(即错误的P值)
作者贡献声明
陈培富:撰写 – 审稿与编辑、撰写 – 原稿、软件开发、资源收集、数据分析、正式分析、数据整理。弗兰克林·德克斯特:撰写 – 审稿与编辑、撰写 – 原稿、数据可视化、验证、方法论设计、研究实施、概念构思。
利益冲突声明
由于职位原因,弗兰克林·德克斯特没有参与本文的同行评审,也无法获取其同行评审信息。