高效精准的全基因组基因-环境互作分析框架SPAGxECCT在大型生物样本库中的应用

《Nature Communications》:

【字体: 时间:2025年03月30日 来源:Nature Communications

编辑推荐:

  编辑推荐:本研究针对大规模生物样本库中复杂性状(如时间-事件和有序性状)的基因-环境互作(G×E)分析难题,开发了可扩展的SPAGxECCT框架。通过混合策略(包括鞍点近似SPA)实现精准p值计算,并扩展出可处理人群分层(SPAGxEmixCCT)和样本相关性(SPAGxE+)的版本。UK Biobank数据分析验证了其高效性和发现能力,为精准医学研究提供新工具。

  在当今基因组学研究中,基因-环境互作(G×E)分析是揭示复杂疾病机制的关键环节。随着UK Biobank等大型生物样本库的涌现,研究者面临两大挑战:一是传统方法仅适用于定量或二元性状,无法处理时间-事件(time-to-event)和有序(ordinal)等复杂性状;二是现有算法难以兼顾计算效率与统计精度,尤其对低频变异和不平衡表型分布的分析存在局限。这些问题严重制约了从海量生物医学数据中挖掘G×E信号的深度和广度。

为解决这些难题,中国医学科学院等机构的研究团队开发了SPAGxECCT分析框架。该研究创新性地采用回顾性策略,将基因型视为随机变量,通过拟合基因型无关模型和混合统计方法(结合正态分布近似与鞍点近似SPA),实现了对多种复杂性状的高效精准分析。相关成果发表在《Nature Communications》上,为大规模G×E研究提供了标准化解决方案。

关键技术方法包括:1)基于Cox比例风险模型处理UK Biobank中281,299例白人英国(WB)样本的时间-事件数据;2)开发混合检验统计量SG×E并通过鞍点近似校准p值;3)扩展SPAGxEmixCCT整合多祖先群体数据(338,044例);4)利用遗传关系矩阵(GRM)构建SPAGxE+处理样本相关性;5)通过局部祖先分析识别祖先特异性效应。

研究结果部分:
"An overview of SPAGxECCT":框架采用两阶段策略,先拟合协变量模型计算残差,再通过投影矩阵消除边际遗传效应。对心脏节律紊乱(CDR,事件率9.06%)等性状的分析显示,相比常规方法,SPAGxECCT计算效率提升15倍。

"Association analysis in the UK Biobank data":发现多个显著G×E信号,如吸烟状态与慢性气道阻塞(CAO)中CHRNA5基因rs16969968(p=6.36×10-9),以及性别与结直肠癌中ZNF521基因rs9950013(p=4.78×10-8)。时间-事件性状分析比二元性状多检出17%位点。

"SPAGxECCT is scalable to analyze large-scale biobank data":在281,299样本中全基因组分析仅需300 CPU小时,较gwasurvivr提速14.7倍。

"Type I error rates simulations":在10,000次模拟中,SPAGxECCT在MAF=0.01、事件率1%时仍保持5.2×10-7的准确I型错误率,而NormGxE出现313.6倍膨胀。

"Power simulation results":n=50,000模拟显示,SPAGxECCT对低频率变异(MAF=0.01)的检测功效比Wald检验提高38%。

讨论与结论部分指出,该研究首次实现跨祖先群体(欧洲与东亚)和复杂性状的统一G×E分析。通过PITX2等基因的性别差异效应验证,揭示了G×E在心脏发育疾病中的生物学意义。局限在于暂不支持基因区域联合检验,未来计划整合多组学数据。这项技术突破将推动电子健康记录(EHR)在精准医学中的深度应用,特别对吸烟相关疾病和癌症性别差异研究具有重要价值。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
    生物通微信公众号
    微信
    新浪微博

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号