MR-Horse方法在疾病进展全基因组关联研究中降低选择偏倚的应用

【字体: 时间:2025年06月04日 来源:European Journal of Human Genetics 3.7

编辑推荐:

  基因组关联研究(GWAS)中疾病进展分析常因病例选择导致碰撞偏倚。本研究创新性应用MR-Horse贝叶斯方法,通过模拟和慢性肾病(CKD)实证数据验证,证明该方法能有效校正遗传相关性引起的偏倚,保留真实效应位点(如UMOD),消除虚假关联(如GATM)。成果发表于《European Journal of Human Genetics》,为复杂疾病遗传架构解析提供稳健工具。

  

在探索疾病进展的遗传机制时,科学家们面临一个棘手难题:全基因组关联研究(GWAS)中因必须选择已患病个体进行分析,会引入"碰撞偏倚"——就像通过筛子筛选石子时,筛孔形状会意外改变石子特性。这种现象尤其影响慢性肾病(CKD)等疾病研究,其中基线肾功能(eGFR)与肾功能下降速度(eGFR斜率)的遗传效应可能相互纠缠。传统校正方法如Dudbridge法和Slope-Hunter法,要么假设遗传效应完全不相关(违背生物学常识),要么依赖"零模态残差假设"(常不成立),导致在遗传相关性显著时反而放大偏倚。

牛津大学的研究团队独辟蹊径,将原本用于孟德尔随机化(MR)的MR-Horse方法改造为GWAS偏倚校正工具。这项发表于《European Journal of Human Genetics》的研究,通过模拟10,000人2000个SNP的遗传数据,设置不同遗传相关性(ρ从-0.8到0.8),系统比较了传统方法与新方法的性能。实证部分则应用CKDGen联盟的eGFR和eGFR斜率GWAS数据,重点验证了已知可能存伪的GATM、CPS1等位点与真实效应的UMOD位点。

研究采用三大关键技术:1)基于Hardy-Weinberg平衡的遗传模拟框架,模拟不同效应类型 SNP(G0无效应、GI仅影响发病率、GP仅影响进展、GIP双重效应);2)MR-Horse贝叶斯模型,使用马蹄先验(horseshoe prior)处理局部(φi)和全局(τ)收缩参数;3)PLINK clump算法筛选独立SNP(r2<0.001),确保分析变量独立性。

模拟研究结果显示:当遗传效应正相关(ρ=0.8)时,未校正分析的GI变异假阳性率高达15%,而MR-Horse方法控制在5%以下。虽然统计功效略有下降(检测0.5%表型方差变异的功率约85%),但该方法在ρ全范围内保持稳定表现,而Dudbridge法在ρ>0.5时偏倚反增200%。

CKDGen数据分析验证了方法的实用性:在基线eGFR调整的GWAS中,肌酐代谢相关GATM位点(β=0.029 mL/min/年)经MR-Horse校正后效应消失(95%可信区间[-0.001,0.010]),而真实效应位点UMOD(rs77924615)仍保持显著(校正后β=0.067 mL/min/年)。敏感性分析证实,即使错误指定先验分布(如假设遗传效应负相关),核心结论依然稳健。

这项研究的突破性在于:首次将MR-Horse的收缩先验优势引入GWAS偏倚校正,通过贝叶斯框架自然处理遗传相关性,无需预设效应分布。作者特别指出,该方法在"遗传效应与混杂效应同向"时优势最大——这正是CKD等复杂疾病的典型特征。讨论部分强调三个关键应用场景:1)药物靶点验证时区分真实进展效应与基线混杂;2)构建多基因风险评分(PRS)时净化噪声信号;3)为非遗传流行病学研究提供偏倚校正系数b的估计。

局限性方面,计算复杂度限制其全基因组应用,需预先筛选F统计量>15的强效SNP;对二分类结局(如终末期肾病)可能存在OR塌陷。未来方向包括开发更高效算法,以及探索非线性效应建模。这项方法论创新为"后GWAS时代"的疾病异质性研究提供了可靠工具,其开源代码发布将加速在癌症转移、阿尔茨海默病等领域的应用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号