-
生物通官微
陪你抓住生命科技
跳动的脉搏
高效精准的全基因组基因-环境互作分析框架SPAGxECCT在大型生物样本库中的应用
《Nature Communications》:
【字体: 大 中 小 】 时间:2025年03月30日 来源:Nature Communications
编辑推荐:
编辑推荐:本研究针对大规模生物样本库中复杂性状(如时间-事件和有序性状)的基因-环境互作(G×E)分析难题,开发了可扩展的SPAGxECCT框架。通过混合策略(包括鞍点近似SPA)实现精准p值计算,并扩展出可处理人群分层(SPAGxEmixCCT)和样本相关性(SPAGxE+)的版本。UK Biobank数据分析验证了其高效性和发现能力,为精准医学研究提供新工具。
为解决这些难题,中国医学科学院等机构的研究团队开发了SPAGxECCT分析框架。该研究创新性地采用回顾性策略,将基因型视为随机变量,通过拟合基因型无关模型和混合统计方法(结合正态分布近似与鞍点近似SPA),实现了对多种复杂性状的高效精准分析。相关成果发表在《Nature Communications》上,为大规模G×E研究提供了标准化解决方案。
关键技术方法包括:1)基于Cox比例风险模型处理UK Biobank中281,299例白人英国(WB)样本的时间-事件数据;2)开发混合检验统计量SG×E并通过鞍点近似校准p值;3)扩展SPAGxEmixCCT整合多祖先群体数据(338,044例);4)利用遗传关系矩阵(GRM)构建SPAGxE+处理样本相关性;5)通过局部祖先分析识别祖先特异性效应。
研究结果部分:
"An overview of SPAGxECCT":框架采用两阶段策略,先拟合协变量模型计算残差,再通过投影矩阵消除边际遗传效应。对心脏节律紊乱(CDR,事件率9.06%)等性状的分析显示,相比常规方法,SPAGxECCT计算效率提升15倍。
"Association analysis in the UK Biobank data":发现多个显著G×E信号,如吸烟状态与慢性气道阻塞(CAO)中CHRNA5基因rs16969968(p=6.36×10-9),以及性别与结直肠癌中ZNF521基因rs9950013(p=4.78×10-8)。时间-事件性状分析比二元性状多检出17%位点。
"SPAGxECCT is scalable to analyze large-scale biobank data":在281,299样本中全基因组分析仅需300 CPU小时,较gwasurvivr提速14.7倍。
"Type I error rates simulations":在10,000次模拟中,SPAGxECCT在MAF=0.01、事件率1%时仍保持5.2×10-7的准确I型错误率,而NormGxE出现313.6倍膨胀。
"Power simulation results":n=50,000模拟显示,SPAGxECCT对低频率变异(MAF=0.01)的检测功效比Wald检验提高38%。
讨论与结论部分指出,该研究首次实现跨祖先群体(欧洲与东亚)和复杂性状的统一G×E分析。通过PITX2等基因的性别差异效应验证,揭示了G×E在心脏发育疾病中的生物学意义。局限在于暂不支持基因区域联合检验,未来计划整合多组学数据。这项技术突破将推动电子健康记录(EHR)在精准医学中的深度应用,特别对吸烟相关疾病和癌症性别差异研究具有重要价值。
下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究
10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!
知名企业招聘
今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号