单细胞eQTL图谱揭示肺癌细胞类型特异性遗传调控新机制
《Cell Genomics》:Single-cell eQTL mapping reveals cell-type-specific genetic regulation in lung cancer
【字体:
大
中
小
】
时间:2025年12月14日
来源:Cell Genomics 9
编辑推荐:
本研究针对肺癌遗传易感性机制不清的问题,通过构建222例正常人肺组织的单细胞eQTL图谱,发现超过60%的eQTLs具有细胞类型特异性,首次系统揭示了AT2细胞和巨噬细胞在肺癌遗传易感性中的关键作用,鉴定出52个候选基因(包括24个新基因),为肺癌精准防治提供了重要资源。
肺癌作为全球癌症相关死亡的主要原因,其发病机制至今仍未完全阐明。虽然全基因组关联研究(GWAS)已鉴定出50多个肺癌风险位点,但由于传统批量组织表达数量性状位点(bulk eQTL)分析技术的局限性,科学家们一直难以揭示这些遗传变异在特定细胞类型中的精确作用机制。肺组织包含超过40种细胞类型,这些细胞在肿瘤发生过程中相互作用,形成了复杂的微环境。然而,当前对肺组织遗传调控的理解大多基于混合细胞群体的分析结果,无法解析细胞类型特异性的调控网络。
为了解决这一难题,南京医科大学沈洪兵、马红霞团队在《Cell Genomics》上发表了最新研究成果。研究人员通过对222名中国人群的正常肺组织进行单细胞RNA测序(scRNA-seq),构建了迄今为止规模最大的肺组织单细胞eQTL(sc-eQTL)图谱。这项研究不仅揭示了细胞类型特异性的遗传调控规律,还深入解析了肺癌易感性的细胞学基础。
研究团队主要采用了多重单细胞RNA测序技术、基因型分型与插补、单细胞eQTL映射分析、条件eQTL分析、多变量自适应收缩(MASHR)分析、转录组范围关联研究(TWAS)、共定位分析(COLOC)、染色质可及性分析以及体外功能验证实验。样本来源于226名接受胸外科手术的中国个体,包括131例肺癌患者和95例非肿瘤性肺疾病患者,所有样本均来自病变远处的正常肺组织。
人类肺细胞图谱在中国LungSCeQTL队列中的特征
研究人员首先对562,255个细胞进行聚类分析,鉴定出21种不同的细胞类型。其中巨噬细胞(MP)占比最高(中位数44.32%),其次是肺泡上皮2型细胞(AT2,12.88%)。通过混合效应模型分析19个与肺癌相关的协变量,发现吸烟是影响肺组织细胞组成的最主要因素,可解释2.1%的跨样本变异性,对单核细胞(5.28%)和AT2细胞(5.24%)的影响尤为显著。
在中国LungSCeQTL队列中跨细胞类型映射eQTLs
研究团队在17种细胞类型中鉴定出4,341个独立eQTLs,对应2,768个eGenes。值得注意的是,60.06%的独立cis-eQTLs和51.30%的eGenes仅存在于特定细胞类型中,且大多数eGenes在多个细胞类型中均有表达,这表明sc-eQTLs主要由细胞类型特异性调控机制驱动,而非基因表达限制。通过多变量自适应收缩分析发现,密切相关的细胞类型之间eQTL效应共享程度更高,例如AT2和AT1细胞之间有47.80%的eQTLs共享,而AT2与NKT细胞之间仅有19.96%。
sc-eQTLs与bulk eQTL及既往研究的比较
与配对的bulk RNA-seq数据集(Bulk219)比较发现,仅有51.7%的独立sc-eQTLs在bulk数据中达到统计学显著。反向分析显示,65.3%的bulk eGenes和57.6%的bulk eQTLs在sc-eQTLs中显著,且主要存在于单一细胞类型。与Natri等人的研究相比,本研究中48.6%的sc-eQTLs在对应细胞类型中得到验证,但本研究发现了更多细胞类型特异性的调控事件。
通过整合五个肺癌GWAS数据集,研究人员在31个已知位点中筛选出33个独立变异体进行分析。根据证据强度将候选基因分为四个等级:等级1包含28个基因(16个位点),具有显著eQTLs和共定位信号;等级2包含12个基因(5个位点),有显著eQTLs但无共定位信号;等级3包含87个基因(7个位点),eQTLs关联呈名义显著;等级4包含3个基因(3个位点),位于snATAC-seq峰上。
研究发现46.43%(13/28)的等级1基因在上皮细胞(主要是AT2细胞)中显示共定位,32.14%(9/28)仅在免疫细胞中显示共定位。值得注意的是,BPTF基因在17q24.2位点表现出相反的共定位信号:rs12602655-G等位基因在MP中与BPTF表达降低相关,而在AT2细胞中与表达增加相关。此外,研究还发现肺癌易感位点存在广泛的多基因调控现象,例如rs174561同时调控六个细胞类型中的FADS1表达,以及MP和单核细胞中的NXF1表达等。
通过TWAS分析,研究团队在17种肺细胞类型中鉴定出250个与肺癌显著相关的基因(FDR<0.1),其中包括178个NSCLC基因、163个LUAD基因和51个LUSC基因。共定位分析进一步识别出30个肺癌易感基因,涉及25个位点。其中50.0%(12/24)的新基因在免疫细胞(主要是巨噬细胞)中显示共定位。
特别值得关注的是,DLX3基因在17q21.33位点显示出强烈的共定位信号。rs3848456-A变异与中国人群(OR=1.17,p=5.12×10-7)和欧洲人群(OR=1.12,p=1.16×10-2)的LUAD风险增加显著相关,并与AT2细胞中DLX3表达升高相关。功能实验表明,DLX3敲低显著抑制AT2细胞活力和克隆形成能力,而过表达则促进这些恶性表型。此外,DLX3敲低上调AT2向AT1转换标志物(SFTPA1、SFTPC、LAMP3),下调LUAD可塑性标志物(MDK、HSF1、CEBPG),而DLX3过表达则上调LUAD可塑性标志物,提示DLX3可能促进AT2细胞向恶性状态转化。
研究人员系统评估了NSCLC候选基因的可成药性,发现32.1%(9/28)的已知区域基因和20.8%(5/24)的新位点基因与已批准或在研药物存在相互作用。特别是针对CLDN18.2的单克隆抗体zolbetuximab和DLX3受体抑制剂IXAZOMIB,显示出肺癌治疗的潜在应用价值。
本研究构建了首个大规模肺组织单细胞eQTL图谱,全面揭示了细胞类型特异性的遗传调控机制。研究发现超过60%的sc-eQTLs具有细胞类型特异性,且大部分在传统bulk分析中无法检测到。通过整合多组学数据,研究确定了AT2细胞和巨噬细胞作为NSCLC易感性的关键细胞媒介,并鉴定出52个候选致病基因,其中24个为新发现基因。
值得注意的是,研究揭示了肺癌易感位点中普遍存在的细胞类型特异性多效性遗传调控现象。47%的已知NSCLC易感位点表现出这种复杂调控模式,包括同一LD区块调控同一细胞类型中的多个基因、同一基因在不同细胞类型中的双向调控,以及单一易感位点调控不同细胞类型中的不同基因。
这些发现不仅深化了对肺癌遗传易感性机制的理解,还为开发针对特定细胞类型和遗传通路的精准医学策略奠定了基础。研究建立的在线数据库(http://ccra.njmu.edu.cn/LungSCeQTL)为后续研究提供了宝贵资源,有望推动肺癌预防和治疗的新突破。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号