
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于突变富集区域(geMER)的泛癌核心驱动基因集鉴定及其驱动机制研究
【字体: 大 中 小 】 时间:2025年08月10日 来源:npj Precision Oncology 8
编辑推荐:
本研究针对癌症驱动基因在编码和非编码区域的复杂作用机制,开发了geMER算法在全基因组范围内识别突变富集区域,鉴定出25种癌症共享的25个核心驱动基因(CDGS)。通过多组学分析揭示了TTN基因I-set结构域突变影响抗原结合能力、APOB基因通过表观遗传调控激活致癌通路等新机制,证实CDGS突变状态可作为泛癌预后标志物和免疫治疗响应预测因子,为癌症精准治疗提供新靶点。
癌症作为基因组疾病,其发生发展受到编码区和非编码区突变的共同驱动。尽管已有大量癌症驱动基因被发现,但非编码区突变(占基因组98%)的功能研究仍存在巨大空白。更关键的是,单个基因的突变往往难以解释癌症复杂的分子机制,而能够跨癌种发挥驱动作用的核心基因集合及其协同机制尚未系统阐明。
哈尔滨医科大学生物信息学团队在《npj Precision Oncology》发表的研究,开发了创新算法geMER(genomic elements Mutation Enrichment Research),通过检测编码区(CDS)、启动子、剪接位点等5类功能元件的突变富集区域,在全基因组范围内识别潜在驱动基因。研究整合33种TCGA癌症的254万个体细胞突变数据,鉴定出16,667个候选驱动基因,进而通过通路富集分析筛选出25个癌症共享的核心驱动基因集(CDGS)。
关键技术包括:1)基于突变积累评分(MAS)和突变富集评分(MES)的geMER算法;2)整合TCGA、GTEx、COSMIC等多组学数据;3)采用CIBERSORT和ssGSEA评估免疫特征;4)利用ENCODE数据库解析表观调控机制。
研究结果
geMER识别候选驱动基因的性能验证
通过健康人群对照分析证实geMER特异性识别肿瘤相关突变(图2C),与DriverPower等工具相比对CGC基因集的富集度提高2.3-4.8倍。PDGFRA在LGG中突变导致表达上调(log2FC=1.8)并与不良预后相关(p=3.2×10-5),验证了方法的可靠性(图3B,E)。
核心驱动基因集的分子特征
CDGS包含10个CGC已知基因和15个新型驱动基因,在25种癌症中显示基因组不稳定性(突变频率9-38%)。TTN的I-set免疫球蛋白结构域突变可能通过改变局部极性影响抗原结合(图4F),而APOB在LIHC中通过激活CEBPA/NR3C1转录因子和H3K4me3等组蛋白修饰上调表达(图5G)。
多组学调控机制
CDGS突变导致启动子区DNA甲基化水平显著降低(p<0.01),其中APOB在HepG2细胞系中表现出强烈的H3K27ac激活标记(图5E)。RYR3作为潜在抑癌基因,其突变与组蛋白抑制标记H3K27me3的增强相关(图S4I)。
临床转化价值
CDGS突变状态是泛癌队列的独立预后因素(HR=1.67, p<0.001),高风险患者具有M2型巨噬细胞浸润增多等免疫抑制特征(图8A)。值得注意的是,这些患者对PD-1/CTLA-4抑制剂的响应率提高2.1倍(p=0.003,图8H-J)。
该研究首次系统揭示了跨癌种核心驱动基因集的协同作用机制,建立的geMER网络平台(http://bio-bigdata.hrbmu.edu.cn/geMER/)为癌症驱动突变研究提供新范式。发现CDGS突变诱导的免疫微环境重塑为联合靶向治疗提供理论依据,特别是APOB等新型驱动基因的表观遗传调控机制,为开发去甲基化药物等治疗策略指明方向。
生物通微信公众号
知名企业招聘