编辑推荐:
本研究针对基因-环境交互作用(G×E)检测难题,提出贝叶斯遗传约束Cox比例风险(BHCox)模型,显著提升检测精度,为复杂疾病预后研究提供有力工具
基因-环境交互作用(G×E)在复杂疾病的发生、发展及
预后中扮演着关键角色。然而,传统的统计方法在处理
高维数据、复杂环境效应以及
生存分析特异性时面临诸多挑战。为解决这一问题,苏州大学公共卫生学院的研究人员提出了一种基于贝叶斯遗传约束Cox比例风险(
BHCox)模型的新方法,该方法通过创新的尖峰-重尾(spike-and-slab)和正则化马蹄(regularized horseshoe)先验,有效整合了效应遗传性,显著提升了对基因-环境交互作用的检测能力。
论文发表于《BMC Bioinformatics》,研究团队通过广泛的模拟实验和非小细胞肺癌(NSCLC)真实数据验证了BHCox模型的优越性能。研究结果表明,BHCox模型在识别主效应和交互效应方面优于其他传统方法,且在预测精度和参数估计准确性上表现出色。该研究为复杂疾病的高维交互作用检测提供了新的思路和工具,具有重要的科学意义和应用价值。
研究背景与问题
在复杂疾病的病因学和预后研究中,基因-环境(G×E)交互作用的检测是理解疾病发生机制和预后影响因素的关键。然而,传统的统计方法在处理高维数据时面临诸多挑战,如数据维度高、环境效应复杂以及生存分析的特异性。此外,效应遗传性(即主效应与交互效应之间的依赖关系)在传统方法中往往未被充分利用,导致检测效果不佳。为克服这些挑战,研究人员开发了一种基于贝叶斯遗传约束Cox比例风险(BHCox)模型的新方法,通过创新的先验分布整合效应遗传性,显著提升了对G×E交互作用的检测能力。
研究方法
研究人员提出了一种基于贝叶斯遗传约束Cox比例风险(BHCox)模型的新方法,用于检测基因-环境交互作用。该方法通过尖峰-重尾(spike-and-slab)和正则化马蹄(regularized horseshoe)先验,整合了效应遗传性,确保了主效应与交互效应之间的依赖关系。研究中使用了无-U-turn采样器(NUTS)算法进行模型拟合,并通过R包brms实现。此外,研究人员通过广泛的模拟实验和非小细胞肺癌(NSCLC)真实数据验证了BHCox模型的性能。
研究结果
模拟实验
研究人员设计了多种模拟场景,验证了BHCox模型在不同数据结构和样本量下的性能。结果表明,BHCox模型在识别主效应和交互效应方面优于其他传统方法,如BCox-SS、BCox-HS、lasso Cox、随机生存森林(RSF)和LAD-hier等。在模拟实验中,BHCox模型的平均真实阳性(M-TP)和交互真实阳性(I-TP)数量更高,而假阳性(M-FP和I-FP)数量更低。此外,BHCox模型在参数估计的均方误差(MSE)和预测精度(C-index)方面也表现出色。
真实数据应用
研究人员将BHCox模型应用于非小细胞肺癌(NSCLC)数据,分析了基因表达、临床因素和吸烟史对患者预后的影响。结果表明,BHCox模型能够识别出具有生物学意义的基因-吸烟交互作用(如AC009299.3×吸烟),这些交互作用与患者的预后密切相关。此外,BHCox模型在模型拟合优度和预测精度方面优于其他传统方法,显示出良好的应用潜力。
研究结论与讨论
本研究提出了一种基于贝叶斯遗传约束Cox比例风险(BHCox)模型的新方法,用于检测基因-环境交互作用。该方法通过创新的尖峰-重尾和正则化马蹄先验,有效整合了效应遗传性,显著提升了对G×E交互作用的检测能力。模拟实验和真实数据验证了BHCox模型的优越性能,特别是在识别主效应和交互效应方面。然而,研究也存在一些局限性,如在处理超高维数据时可能面临计算效率问题,且在真实数据中未能检测到更多显著的交互作用。未来的研究将致力于开发更高效的算法,以应对超高维数据的挑战,并进一步优化模型以提高检测精度和生物学解释性。
娑撳娴囩€瑰宓庢导锔炬暩鐎涙劒鍔熼妴濠団偓姘崇箖缂佸棜鍎禒锝堥樋閹活厾銇氶弬鎵畱閼筋垳澧块棃鍓佸仯閵嗗甯扮槐銏狀洤娴f洟鈧俺绻冩禒锝堥樋閸掑棙鐎芥穱鍐箻閹劎娈戦懡顖滃⒖閸欐垹骞囬惍鏃傗敀
10x Genomics閺傛澘鎼isium HD 瀵偓閸氼垰宕熺紒鍡氬劒閸掑棜椴搁悳鍥╂畱閸忋劏娴嗚ぐ鏇犵矋缁屾椽妫块崚鍡樼€介敍锟�
濞嗐垼绻嬫稉瀣祰Twist閵嗗﹣绗夐弬顓炲綁閸栨牜娈慍RISPR缁涙盯鈧鐗哥仦鈧妴瀣暩鐎涙劒鍔�
閸楁洜绮忛懗鐐寸ゴ鎼村繐鍙嗛梻銊ャ亣鐠佹彃鐖� - 濞e崬鍙嗘禍鍡毿掓禒搴n儑娑撯偓娑擃亜宕熺紒鍡氬劒鐎圭偤鐛欑拋鎹愵吀閸掔増鏆熼幑顔垮窛閹貉傜瑢閸欘垵顫嬮崠鏍掗弸锟�
娑撳娴囬妴濠勭矎閼崇偛鍞撮摂瀣鐠愩劋绨版担婊冨瀻閺嬫劖鏌熷▔鏇犳暩鐎涙劒鍔熼妴锟�