编辑推荐:
本文通过对英国生物银行(UKB)和 “我们所有人”(AOU)队列数据的分析,评估电子健康记录(EHR)研究痴呆相关临床因素时的检测偏倚。发现多种疾病诊断与短期痴呆诊断可能性增加有关,提示检测偏倚可能导致虚假关联,研究意义重大。
研究背景
电子健康记录(EHR)为痴呆研究提供了丰富临床信息,但也带来挑战。检测偏倚(detection bias)在 EHR 研究中普遍存在,当一种暴露与结果确定或诊断的系统差异相关时就会发生。例如,患有其他疾病而频繁接触医疗保健系统的患者,更易被诊断出痴呆,这可能导致医疗条件与痴呆风险之间的关联估计出现偏差。目前,缺乏 EHR - 痴呆研究中检测偏倚程度的证据,量化该偏倚对解释临床研究至关重要,本研究旨在填补这一空白。
研究方法
- 研究对象:选取 UKB 和 AOU 队列中 55 岁及以上、基线时无痴呆且有 EHR 数据的参与者。UKB 队列 2006 - 2010 年招募,随访至 2022 年 12 月;AOU 队列 2017 - 2022 年招募,随访至 2022 年 7 月。
- 暴露与结局确定:从 EHR 中确定 2 型糖尿病(T2D)、抑郁症、高血压、尿路感染(UTI)、肾结石、前臂骨折和胃肠道(GI)出血等暴露诊断,以及包括多种类型的全因痴呆诊断。
- 医疗保健利用评估:计算参与者暴露诊断前后 1 年(有暴露史)或入组前后 1 年(无暴露史)的医疗保健接触次数,评估暴露与医疗保健利用的关系。
- 统计分析:采用 Cox 比例风险回归模型评估暴露与痴呆诊断的关联,对比 EHR 估计关联与已有队列研究或荟萃分析结果,并分析关联随时间的变化。还进行了多项敏感性分析,以验证结果的可靠性。同时,用差异 - 差异负二项回归模型分析暴露与医疗保健利用的关联,以及医疗保健利用与痴呆的关联。
研究结果
- 研究样本特征:UKB 队列 137374 名参与者,平均年龄 62.5(4.1)岁,女性占 53.8%;AOU 队列 91018 名参与者,平均年龄 66.9(7.8)岁,女性占 57.1%。两个队列中不同暴露诊断的比例各异,随访期间 UKB 有 4095 例、AOU 有 952 例新痴呆诊断。
- 临床暴露与痴呆的关联:所有 7 种临床暴露均与痴呆发病率呈正相关,风险比(HR)范围为 1.18(95% CI,1.00 - 1.40)至 3.51(95% CI,3.08 - 4.01)。如 T2D 在 UKB 和 AOU 队列中的 HR 分别为 1.94(95% CI,1.79 - 2.10)和 2.43(95% CI,2.11 - 2.79),均高于已有队列研究的荟萃分析结果。多数暴露在诊断后的第一年,痴呆发病率最高,随后 HR 逐渐降低。例如,GI 出血诊断后第一年,UKB 和 AOU 队列中痴呆发病风险大幅增加(HR 分别为 2.17 和 2.56),1 - 5 年后 HR 降至 1.46 和 2.14。
- 检测偏倚程度评估:对所有暴露进行荟萃分析,发现暴露后第一年与长期平均关联的平均 HR 为 1.60(95% CI,1.15 - 2.22),但 HR 范围为 0.74(95% CI,0.49 - 1.11)至 3.53(95% CI,2.97 - 4.20),且I2统计量为 83.8%,表明检测偏倚存在较大异质性。
- 敏感性分析结果:高医疗保健利用水平的参与者,临床暴露与新痴呆诊断的 HR 略低于总体关联;低医疗保健利用水平的参与者,检测偏倚更大。排除基线时有暴露诊断的参与者,结果无显著变化。改变对比时间或对比对象,荟萃分析估计的检测偏倚 HR 有所变化。
- 二次分析结果:多数暴露诊断后,医疗保健利用增加。如 UKB 和 AOU 队列中,前臂骨折诊断后,医疗保健利用频率分别增加 15.2%(95% CI,11.0% - 19.6%)和 27.7%(95% CI,25.2% - 30.2%)。基线前一年的医疗保健利用与痴呆发病率相关(UKB HR 为 1.03 / 次额外接触,AOU HR 为 1.02 / 次额外接触) 。
讨论
本研究中,所有临床暴露,包括与痴呆生理联系微弱的因素,均与 EHR 记录的新痴呆诊断正相关。观察到的 HR 比已有队列研究结果更显著,且多数 HR 随暴露诊断时间推移而减弱。短期关联可能主要归因于检测偏倚,即患者因接受其他疾病治疗而增加了被诊断出痴呆的机会,导致虚假关联。误诊也可能对结果有贡献,如 UTI、骨折、GI 出血和抑郁症相关的认知症状可能被误诊为痴呆。
检测偏倚虽已被认识,但很少有研究量化其程度。本研究通过多暴露分析和以医疗保健利用为共同机制,对偏倚程度进行了探索。痴呆诊断具有接触依赖性,受多种因素影响。研究结果显示,EHR 随访研究中定期进行直接认知评估可能有价值,要求多次诊断可减少误诊偏倚。未来研究应利用更详细临床数据,进一步量化偏倚,并明确检测偏倚是否仅通过增加医疗保健利用起作用。使用 EHR 数据进行研究时,需谨慎考虑潜在局限性。
研究局限性
本研究存在一些局限性,包括可能的残余混杂因素、未评估不同医疗保健环境差异、EHR 记录可能缺失以及两个队列均为便利样本。无法排除其他研究偏倚,如虚弱导致的残余混杂。未区分不同医疗设施的接触,限制了对偏倚机制的深入探索。此外,EHR 数据可能不完整,还可能存在健康志愿者选择偏倚。不过,这些局限性不太可能解释主要研究结果。
研究结论
本研究对两个大型数据集的队列分析表明,多种与痴呆风险不同的疾病诊断,与短期痴呆诊断可能性增加有关,提示 EHR 研究痴呆临床因素时可能存在检测偏倚。在 EHR - 痴呆研究中,应直接评估和解决检测偏倚问题。本研究的策略可用于检测偏倚,如估计时变暴露等分析方法可能减轻偏倚影响。