编辑推荐:
为解决传统吸烟量化方法易产生偏差、现有生物标志物区分能力有限的问题,研究人员开展了吸烟与 DNA 甲基化(DNAm)关系的多组织、多队列研究。结果发现新位点,开发出 mCigarette 生物标志物,明确了吸烟的组织特异性影响。该研究增强了对吸烟影响的理解,有助于相关疾病防治。
吸烟,这个在生活中常见却又危害巨大的行为,每年在全球范围内夺走约 800 万人的生命,与 50 多种疾病紧密相连,如心血管疾病、肺癌和痴呆症等。在临床风险评估中,准确衡量吸烟量对预防和治疗相关疾病至关重要。然而,传统的依靠自我报告问卷获取吸烟信息的方式,容易受到回忆偏差的影响,而且无法考量被动吸烟的情况。常用的尼古丁生物标志物可替宁,其平均半衰期仅 15 - 20 小时,难以区分近期戒烟者和从不吸烟者,在评估长期疾病风险时存在很大局限性。因此,寻找更精准、客观的吸烟评估方法迫在眉睫。
在此背景下,来自英国多个研究机构的研究人员,包括爱丁堡大学、布里斯托大学等,开展了一项针对吸烟与 DNA 甲基化(DNAm)关系的多组织、多队列研究。该研究成果发表在《Nature Communications》上,为深入了解吸烟对健康的影响提供了新的视角。
研究人员主要运用了以下几种关键技术方法:一是对多个队列进行研究,如 Generation Scotland 队列、Lothian Birth Cohort 1936 队列和 Avon Longitudinal Study of Parents and Children(ALSPAC)队列,获取丰富的样本数据;二是采用多种 DNA 甲基化检测技术,像 Illumina EPIC 阵列、TWIST 人类甲基化组面板和牛津纳米孔测序(ONT)技术,从不同层面分析 DNAm 水平;三是运用全基因组关联研究(GWAS)和表观基因组关联研究(EWAS)等方法,探究吸烟相关的遗传和表观遗传位点 。
下面来详细看看研究结果:
- 吸烟的 EWAS 分析:对 Generation Scotland 队列中 17,865 名志愿者进行 Bayesian EWAS 分析,发现 DNAm 可解释吸烟包年表型 50.0% 的方差。42 个独立的 CpG 位点与吸烟相关,其中部分位点此前未在 EWAS 目录中报道,涉及神经发育和成瘾相关基因。
- 高分辨率 EWAS 分析:对 46 名个体进行高分辨率 EWAS 分析,使用 TWIST 和 ONT 技术检测到更多与吸烟相关的位点。TWIST EWAS 在严格阈值下发现 33 个相关位点,基因集富集分析显示吸烟影响细胞外基质相互作用、慢性炎症等通路。ONT EWAS 在严格阈值下发现 9 个相关位点,虽未发现显著富集基因集,但这些位点与肿瘤抑制、神经发育相关。
- 吸烟生物标志物 mCigarette 的开发:利用弹性网络回归在 Generation Scotland 队列中开发出 mCigarette 生物标志物。在 LBC1936 队列测试中,其区分当前、既往和从不吸烟者的能力优秀,在 ALSPAC 队列不同年龄组也有良好表现,且在预测吸烟包年数上优于部分已有的表观遗传评分。
- 组织特异性分析:对 LBC1936 队列 14 名个体的 5 个脑区进行研究,发现不同脑区与吸烟状态相关的位点无重叠,且血液和脑区中能区分吸烟状态的位点也不重叠,血液来源的 mCigarette 在脑区无法区分吸烟类别。
- GWAS 分析:对自我报告和表观遗传吸烟进行 GWAS 分析,发现 GrimAge DNAm 包年估计值与自我报告包年数的遗传相关性为 0.62。GrimAge DNAm 包年 GWAS 结果与以往自我报告吸烟 GWAS 结果有部分重叠,涉及 CHRNA3、CHRNA5 等基因,这些基因与尼古丁依赖和疾病相关。
研究结论和讨论部分表明,该研究通过多组织、多队列分析,显著提升了对吸烟生物学后果的理解以及客观测量吸烟的能力。发现了新的与吸烟相关的位点,进一步揭示了吸烟影响健康的潜在机制。mCigarette 生物标志物在预测吸烟状态和包年数方面表现出色,为未来监测吸烟和相关疾病风险评估提供了有力工具。然而,研究也存在一定局限性,如可能无法推广到非欧洲人群、脑和全甲基组样本数量较少等,但这些并不影响其在吸烟相关研究领域的重要意义。总体而言,这项研究为深入了解吸烟的表观遗传机制和防治吸烟相关疾病奠定了坚实基础,为后续研究指明了方向 。