编辑推荐:
研究人员开展多风险因素观察性研究中混杂因素调整方法的研究,发现方法差异大,互调常见,应分别调整。
在医学研究的广阔领域中,观察性研究就像一座桥梁,连接着各种风险因素与疾病之间的关系。然而,这座桥梁上却存在一个 “暗礁”—— 混杂因素。混杂因素就像是隐藏在研究背后的 “捣乱分子”,严重威胁着因果推断研究的内部有效性。在研究单个风险因素与疾病的关系时,识别混杂因素相对容易。但当研究涉及多个风险因素时,情况就变得复杂起来。
打个比方,在研究心血管疾病(CVD)的多个风险因素时,就如同进入了一个错综复杂的迷宫。每个风险因素在不同的因果关系中,可能扮演着不同的角色,时而像个 “干扰者”(混杂因素),时而又像个 “传递者”(中介变量),时而还可能是个 “调节者”(效应修饰因子)。例如,吸烟、饮酒、高血压等因素,它们之间的关系盘根错节,而且在与心血管疾病的关联中,各自的作用也不相同。
在这样复杂的情况下,正确调整混杂因素就变得至关重要。以往的研究中,研究人员常常采用各种方法来处理混杂因素,但这些方法是否合适,却很少有人深入探讨。有些研究把所有风险因素一股脑地放进多变量回归模型中进行相互调整,就像把各种食材随意混合在一起烹饪,结果可能导致系数估计出现偏差,就像菜的味道变得奇怪一样,无法准确反映每个因素的真实作用。还有些研究则是对所有风险因素都调整相同的混杂因素,这也可能不合适,就好比给不同的病症都开同一种药。
为了揭开多风险因素观察性研究中混杂因素调整的神秘面纱,来自中南大学湘雅公共卫生学院等机构的研究人员 Yinyan Gao、Linghui Xiang 等开展了一项方法学研究。该研究成果发表在《BMC Medicine》杂志上。
研究人员为开展此项研究,首先制定了详细的筛选标准。他们将研究结果限定为心血管疾病、糖尿病和痴呆这三种主要慢性病。研究对象需是成年人(年龄≥18 岁),研究设计必须是队列研究或病例对照研究,且要采用多变量回归模型(如 Cox 回归、逻辑回归等)来估计效应。研究还要求相关文献发表在《Science Citation Index Expanded(SCIE)》收录的期刊上。通过这些标准,研究人员从 2018 年 1 月至 2023 年 3 月的 PubMed 数据库中筛选出了 162 项研究。
研究人员对这些研究进行了细致的分类和分析。他们把研究目的分为两类:一类是广泛探索潜在风险因素,另一类是检验特定风险因素与结果之间的关联。对于混杂因素调整方法,他们总结归纳出六类,其中 “每个风险因素分别调整潜在混杂因素” 被认定为推荐方法。在混杂因素选择方法上,研究人员也进行了详细的梳理和分析。
在研究结果方面,这 162 项研究的分布十分广泛。从发表年份来看,涵盖了 2018 - 2023 年;从国家来看,中国和美国的研究较多;从期刊类别来看,涉及医学、临床神经病学、心血管系统等多个领域。在研究目的上,88 项(54.3%)旨在广泛探索潜在风险因素,74 项(45.7%)聚焦于检验特定风险因素。在混杂因素调整方法的使用上,情况却不容乐观。仅有 10 项(6.2%)研究采用了推荐方法,且这些研究都聚焦于检验特定风险因素。而超过 70% 的研究采用了相互调整的方法,即将所有风险因素纳入多变量模型。在混杂因素选择方法上,检验特定风险因素的研究更多依赖先验知识,而探索潜在风险因素的研究则更多使用数据驱动的方法。
研究结论和讨论部分表明,多风险因素观察性研究中混杂因素调整方法差异巨大。相互调整是最常用的方法,但这可能导致过度调整偏差,使效应估计产生误导。研究人员建议,在研究多风险因素时,应分别针对每个风险因素 - 结果关系调整混杂因素,而不是简单地将所有因素纳入多变量模型。同时,研究人员还推荐使用因果图(Directed Acyclic Graph,DAG)或改良的析取因果标准来识别混杂因素集。此外,数据驱动的变量选择方法容易导致相互调整,增加调整偏差的风险,在样本量足够大时,应优先采用基于知识的方法。并且,研究人员还强调了提高混杂因素调整报告透明度的重要性,建议作者遵循《Strengthening the Reporting of Observational Studies in Epidemiology(STROBE)》声明,期刊也应采取措施提高报告质量。
这项研究为多风险因素观察性研究中的混杂因素调整指明了方向,让后续研究在处理这个复杂问题时有了更清晰的思路,对推动医学研究的准确性和可靠性具有重要意义。它就像一盏明灯,照亮了医学研究中这片曾经迷雾重重的领域,为揭示疾病与风险因素之间的真实关系奠定了更坚实的基础。