整合精准注释提升无义介导mRNA降解规则:基于1086例多组学数据的系统评估
《Nucleic Acids Research》:Integrative and accurate annotations enhance current nonsense-mediated mRNA decay rules
【字体:
大
中
小
】
时间:2025年12月03日
来源:Nucleic Acids Research 13.1
编辑推荐:
本研究针对PTCs(premature termination codons)变异致病性评估中NMD(nonsense-mediated mRNA decay)逃逸规则覆盖不全的问题,通过整合1086例匹配基因组与转录组数据,系统评估了MNVs(multi-nucleotide variants)、翻译状态和RNA异构体对NMD效率的影响。研究发现精准注释使NMD效率解释力提升12.0%,揭示了高频变异和低保守区域通过MNVs或核糖体未翻译机制逃逸NMD的生物学机制,为遗传病致病性判定提供了新范式。
在人类遗传疾病研究中,由无义变异、移码InDels和剪接异常产生的提前终止密码子(PTCs)可能导致截短蛋白的产生,通过功能丧失、显性负效应或获得性功能效应引发疾病。无义介导的mRNA降解(NMD)作为真核生物保守的mRNA监视系统,能识别并降解含PTCs的转录本,但部分PTCs却能逃逸NMD降解。这种逃逸现象在疾病相关基因中尤为关键——仅逃逸降解的无义变异才引发疾病,而触发NMD的变异反而可能通过抑制截短蛋白加重表型。因此,准确判断PTCs是否触发NMD成为理解变异致病性的核心难题。
现有研究提出了PTC位置依赖的NMD逃逸规则:若PTC位于最后一个外显子或距最后一个外显子-外显子连接处<50-55核苷酸(50-nt规则)、起始密码子150核苷酸内(起始近端规则)或长度>407核苷酸的外显子(长外显子规则),则倾向于逃逸NMD。尽管这些规则可解释约70%的NMD效率变异,但等位基因频率(AF)和基因组保守性(如PhyloP评分)等因素的生物学机制尚未明确,暗示存在未被发现的规则。此外,RNA异构体表达和多核苷酸变异(MNVs)可能通过改变编码区解读或翻译状态影响NMD效率,但既往系统分析未整合这些因素。
为突破现有规则局限,九州大学与大阪制药研究团队通过分析gnomAD、GEUVADIS和MAGE项目中1086例匹配基因组与转录组数据,构建个体特异性基因组进行RNA-seq比对,采用RSEM进行转录本定量,并利用Ribo-seq数据评估翻译状态。通过随机森林回归模型量化各因素对NMD效率(以变异等位基因频率VAF为指标)的贡献度,系统重构了NMD逃逸规则的解释框架。
研究首先验证了经典位置规则的有效性:74.5%的NMD触发型SNVs呈现等位基因失衡(VAF<0.35),而50-nt规则和起始近端规则组仅16.7%和31.8%显示降解迹象,长外显子规则组虽有58.2%失衡,但逃逸趋势仍显著高于触发组。基因表达水平分析进一步证实,携带NMD触发型SNVs的个体其基因表达量显著降低。
- 1.MNVs重定义变异本质:5.5%的MNVs为"救援型无义MNVs"——其组分含无义SNV但组合效应不产生终止密码子。如MAN2A2基因中rs142925505(C>T)与rs2106673(A>G)构成的MNV将密码子CAG变为TGG(Gln→Trp),VAF为0.495且无降解证据。88%的此类MNVs无等位基因失衡,且组分SNVs的AF显著高于典型无义SNVs,部分为常见变异。
- 2.翻译状态决定NMD激活前提:约4%的蛋白编码基因(如GSDMB)虽转录活跃(TPM≥1)却几乎无核糖体结合,其PhyloCSF评分显著低于翻译基因。82%位于非翻译基因的无义SNVs(VAF>0.35)逃逸NMD,从机制上解释了低保守区域变异逃逸现象。
- 3.RNA异构体复杂性:14.6%的无义SNVs存在异构体混合表达(如CELF1基因中MANE Select异构体适用50-nt规则,而含3'UTR剪接位点的异构体属NMD触发型)。主要表达异构体为NMD触发型时,其相对表达量显著低于逃逸型异构体,印证NMD按异构体特异性激活。
精准注释后(排除346个混淆SNVs),NMD触发型SNVs的降解比例升至85.5%。随机森林模型显示,整合注释使NMD效率解释方差提升12.0%(55%→67%),其中50-nt规则贡献最大(R2=30.2%),起始近端规则次之(R2=12.5%)。新注释特征(MNVs、翻译状态、异构体)解释力达4.0%-5.9%,超过长外显子规则。AF和保守性等模糊特征的贡献度下降,表明其部分生物学机制已被新注释解析。
本研究通过多维度数据整合,证实PTC位置依赖规则是NMD靶向选择的核心框架,且其适用性比既往认知更广泛。MNVs重注释、翻译状态验证及异构体层级分析,为遗传病致病性判定提供了更精准的注释标准。尽管长读长RNA-seq可进一步提升异构体定量精度,且VAF与总表达量的差异可能涉及转录适应机制,但本研究确立的整合注释策略无疑为基因组规模的NMD逃逸机制评估树立了新标杆。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号