仅病例设计检测基因交互作用的关键发现与应用指南

【字体: 时间:2025年03月07日 来源:BMC Genomics 3.5

编辑推荐:

  研究人员针对仅病例设计检测基因 × 基因(G×G)和基因 × 环境(G×E)交互作用展开研究,发现多种因素影响其错误率,为应用提供指南。

  

基因交互作用研究的新突破:仅病例设计的深度剖析

在生命科学的神秘领域中,基因与环境如何相互作用影响人类复杂性状,一直是科学家们努力探索的重要课题。全基因组关联研究(GWAS)虽然已检测出数千种复杂性状与数百万个单核苷酸变异(SNVs)的关联,但这些研究大多聚焦于主效应,而基因变异与环境因素之间的交互作用(G×E)或基因变异之间的交互作用(G×G,又称上位性),可能才是解开 “遗传力缺失” 谜题的关键。
过去,由于样本量不足,大多数研究难以检测到这些交互作用。然而,随着大型生物样本库(如英国生物样本库)的出现,其中包含了丰富的遗传和环境数据,使得检测交互作用成为可能。在众多检测 G×E 交互作用的方法中,仅病例设计自被提出后便备受关注,它也可用于研究 G×G 交互作用。但该设计在应用时需满足两个重要假设:疾病应罕见,且 G 和 E 或 G 和 G 相互独立。尽管第二个假设已有较多研究,可通过对照数据进行评估,群体分层和偏离哈迪 - 温伯格平衡(HWE)对其影响也有探讨,但罕见病假设却一直未得到深入研究。在实际应用中,仅病例设计已被用于多种疾病患病率差异较大的复杂性状研究,然而这些研究是否满足罕见病假设,以及使用该设计是否合适,都尚不明确。
为了深入探究这些问题,来自哥伦比亚大学医学中心(Center for Statistical Genetics, Gertrude H. Sergievsky Center, and the Department of Neurology, Columbia University Medical Center)和耶鲁大学公共卫生学院(Department of Chronic Disease Epidemiology and Center for Perinatal, Pediatric and Environmental Epidemiology, Yale School of Public Health)的研究人员 Rui Dong、Gao T. Wang、Andrew T. DeWan 和 Suzanne M. Leal 展开了一项全面的研究。他们的研究成果发表在《BMC Genomics》上,为仅病例设计在基因交互作用研究中的应用提供了重要的指导。

研究方法

研究人员主要采用了两种关键技术方法:
  1. 模拟研究:研究人员生成了大量数据,涵盖遗传变异(分别在显性和加性模型下)和二元环境暴露情况。通过设置不同的主效应范围、疾病患病率、样本大小、遗传变异的次要等位基因频率(MAF)和环境暴露频率,模拟多种场景。在评估 I 型错误时,设定遗传变异和环境暴露无交互作用;评估效能时,则设定存在交互作用( )。对于仅病例设计和病例 - 对照设计,分别使用特定公式和逻辑回归模型来估计交互效应,并通过多次重复实验计算 I 型错误率和效能。
  2. 理论和分析研究:研究人员构建了理论框架,以揭示交互效应与病例和对照中 G 和 E 之间优势比(OR)的关系。通过比较估计的交互效应( )与真实交互效应( ),推导出分析偏差的公式,明确了疾病患病率、主效应等因素对偏差的影响。

研究结果

  1. I 型错误 —— 仅病例设计和病例 - 对照设计:随着疾病患病率的增加,仅病例设计的 I 型错误率通常会升高,当疾病患病率≥4% 时,I 型错误率会膨胀。例如,当疾病患病率为 4% 时,仅病例设计在 时的 I 型错误率分别为 0.001098 和 0.051387;患病率为 20% 时,I 型错误率大幅上升至 0.002091 和 0.070049。而病例 - 对照设计即使在疾病患病率为 20% 时,I 型错误率仍能得到良好控制。当一个或两个主效应不存在时,仅病例设计在高疾病患病率(如 20%)下 I 型错误率也能得到有效控制12
  2. 主效应与仅病例设计的 I 型错误:研究表明,若一个或两个主效应较强,为控制 I 型错误率,疾病患病率应 < 4%。当两个主效应都很强(如 ),即使疾病患病率低至 1%,I 型错误率也会大幅膨胀( 时为 0.141321)。有趣的是,当主效应具有保护作用时,仅病例设计可应用于更高患病率的疾病,且不会出现 I 型错误率膨胀的问题3
  3. 暴露频率与仅病例设计的 I 型错误:遗传变异和环境暴露频率也会影响仅病例设计的 I 型错误率。I 型错误率会先随变异和环境暴露频率增加而上升,当次要等位基因变为主要等位基因或超过 50% 的人群暴露时,I 型错误率会下降。不过,与主效应和疾病患病率的影响相比,其影响相对较小4
  4. 样本量与仅病例设计的 I 型错误:样本量对仅病例设计的 I 型错误率也有影响。当疾病患病率为 4% 且存在两个主效应( )时,随着样本量从 2500 增加到 10000 再到 50000,I 型错误率逐渐上升。若样本量为 20000,疾病患病率应≤2% 才能控制 I 型错误率;若样本量为 2500,疾病患病率为 5% 时 I 型错误率仍能得到良好控制5
  5. 统计效能 —— 仅病例设计和病例 - 对照设计:在显性模型下,当疾病患病率≤5% 且存在两个主效应( )时,仅病例设计的效能高于病例 - 对照设计,即使对照与病例比例(R)为 3 时也是如此。当疾病患病率为 1% 时,仅病例设计和病例 - 对照设计(R = 1)的效能分别为 0.93 和 0.56;患病率增加到 4% 时,仅病例设计的效能(0.87)仍显著高于病例 - 对照设计(0.55)。当一个或两个主效应不存在时,仅病例设计的效能也显著高于病例 - 对照设计,即便其样本量较小。不过,当疾病患病率达到 20% 时,病例 - 对照设计(R = 1)的效能才会超过仅病例设计6
  6. 偏差 —— 分析结果:在零假设下,当一个或两个主效应不存在时, 的偏差为 0;当主效应使患病风险增加或降低时, 会低估真实交互效应,导致负偏差,且疾病患病率越高偏差越大。在备择假设下,即使没有主效应, 也会低估交互效应。偏差与仅病例设计的 I 型和 II 型错误率密切相关,偏差越大,I 型错误率越高7

研究结论与讨论

通过理论和模拟分析,研究人员发现疾病患病率、主效应、变异和环境暴露频率以及样本量等多种因素,会影响仅病例设计中交互项的偏差以及 I 型和 II 型错误率。一般来说,在 G 和 E 独立的假设下,当疾病患病率 <4% 时,仅病例设计的 I 型错误率不会膨胀;但患病率较高时,I 型错误率会升高,交互效应的估计也会出现偏差。当疾病患病率> 20% 时,仅病例设计的效能可能低于病例 - 对照设计。
研究人员建议,仅病例设计适用于检测低患病率复杂性状(如卵巢癌和乳糜泻)中的交互作用,且应限制对不存在强主效应的变异和环境暴露进行交互作用检测。此外,研究人员还提供了 CaseOnly R 代码,可用于模拟和分析数据,评估仅病例设计的 I 型错误率和统计效能,为研究人员提供了有力的工具。
这项研究为仅病例设计在基因交互作用研究中的应用提供了明确的指导,有助于研究人员更准确地选择研究方法,合理设计实验,从而推动基因与环境交互作用领域的研究进展,为揭示复杂性状的遗传机制奠定了坚实基础。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
生物通微信公众号
微信
新浪微博

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号