编辑推荐:
为探究插入缺失(indels)对蛋白质影响,研究人员开展相关研究,构建 INDELi 模型,助力相关研究。
在生命科学的微观世界里,基因变异如同一场神秘的 “魔术表演”,不断塑造着蛋白质的模样,影响着生命的进程。氨基酸插入和缺失(indels)作为一类丰富的遗传变异,在人类基因组中约占所有变异的 12%。然而,与常见的碱基替换相比,它们对蛋白质稳定性和功能的影响却如同隐藏在迷雾之中,难以捉摸。许多流行的变异效应预测(VEP)算法甚至无法为 indels 提供评分,现有的计算方法也难以准确预测其影响,这无疑给相关研究带来了巨大的挑战。为了揭开 indels 的神秘面纱,来自巴塞罗那科技学院基因组调控中心(Centre for Genomic Regulation,CRG)、庞培法布拉大学(University Pompeu Fabra,UPF)等机构的研究人员展开了深入研究。他们的研究成果发表在《Nature Communications》上,为我们理解 indels 的奥秘提供了重要线索。
研究人员采用了多种关键技术方法。在实验方面,运用深度插入缺失诱变(DIM)技术,对结构多样的蛋白质结构域进行研究;利用蛋白质片段互补分析(PCA),即 abundancePCA(aPCA),精确量化每个变体对蛋白质结构域丰度的影响;还通过蛋白质 - 蛋白质相互作用选择测定法,探究 indels 对蛋白质结合的影响。在数据分析和模型构建方面,借助生物信息学手段,整合实验数据和计算预测结果,构建了一系列 INDELi 模型,用于预测 indels 对蛋白质稳定性和致病性的影响。
研究结果如下:
- 体内蛋白质结构域丰度的深度插入缺失诱变:研究人员设计了包含多种变异类型的文库,对 9 个结构多样的蛋白质结构域进行深度插入缺失诱变。通过 aPCA 测定,发现所有蛋白质结构域对氨基酸缺失高度不耐受,1 个氨基酸缺失大多会显著降低丰度;1 个氨基酸的拷贝数变化(CCC)插入耐受性稍好,但总体上不同结构域对 indels 的耐受性差异较大。此外,约 1% 的 indels 可使蛋白质结构域丰度高于野生型水平,这些 indels 主要位于蛋白质结构域的 N 或 C 末端。
- 插入缺失与替换的影响对比:对 PSD95 - PDZ3和 GRB2 - SH3这两种蛋白质的研究表明,在不同蛋白质中,替换耐受性与插入、缺失耐受性的相关性有所不同。在 PSD95 - PDZ3中,替换耐受性与删除残基及 CCC 插入的耐受性相关性较好;而在 GRB2 - SH3中,替换耐受性仅与替换位点后 CCC 插入的耐受性有一定相关性。进一步分析大规模诱变数据集发现,替换耐受性在预测环区的插入和删除耐受性时表现更好,这为预测 indel 变异效应提供了思路。
- 不同氨基酸的插入:虽然 CCC 插入在自然基因组中最为常见,但实验发现不同氨基酸插入的影响存在差异。大多数位置上,1 个氨基酸插入的变异效应标准差较低,但在某些位点,插入不同氨基酸会产生截然不同的效果。总体而言,插入氨基酸的平均效应与替换为相同氨基酸的平均效应相关,但插入的影响通常更有害。
- DelSubs:研究人员对 325 个 DelSubs(一种特殊的变异,指一个氨基酸被删除且下一个氨基酸被替换)进行了量化分析,发现其影响与相同残基的 1 个氨基酸缺失相关性良好,但在部分 1 个氨基酸缺失可耐受的位点,DelSubs 会导致蛋白质不稳定。
- 插入缺失耐受性的结构决定因素:以往研究提出了许多关于插入和缺失耐受性结构决定因素的假设。通过对大量变异的分析发现,溶剂可及性在决定 indels 耐受性方面的作用比替换耐受性小得多。蛋白质的 N 和 C 末端、环区相对更能耐受 indels,而 β - 链对 indels 相对更敏感,但差异较小。
- 评估插入缺失变异效应预测:研究人员评估了多种计算 indel 变异效应预测工具(VEPs),如 CADD、PROVEAN 和 ESM1b 等。结果显示,CADD 对插入和删除的预测性能较差,PROVEAN 在预测删除和插入时表现一般,且不同蛋白质间差异较大,ESM1b 的预测性能相对较好,但不同结构域间也存在差异。
- 使用 INDELi 准确预测插入缺失变异效应:研究人员构建了 INDELi 模型,该模型结合了实验测量或计算预测的替换分数以及蛋白质二级结构信息。实验结果表明,INDELi 模型在预测 indels 对蛋白质稳定性的影响方面表现出色,与现有先进的替换变异效应预测工具性能相当,且在不同结构域间的预测性能更稳定。
- 使用 INDELi 进行全基因组稳定性和致病性插入缺失预测:研究人员利用 INDELi - E 模型对人类蛋白质组中 1 个氨基酸插入和删除对蛋白质稳定性的影响进行全基因组预测,得到了超过 1470 万条预测结果。此外,INDELi - E 模型在预测人类致病性变异方面表现良好,表明蛋白质折叠稳定性的改变是氨基酸 indels 导致人类遗传疾病的主要机制。
- 插入产生功能获得性分子表型:研究人员通过对 GRB2 - SH3和 PSD95 - PDZ3与配体结合的研究发现,虽然插入和删除通常会导致功能丧失,但 PSD95 - PDZ3中某些环区的插入会显著增强其与配体的结合,产生功能获得性分子表型。
综上所述,该研究通过深度插入缺失诱变技术,系统地量化、理解并学会预测 indels 对蛋白质折叠稳定性的影响。研究表明,indels 和替换对蛋白质的影响存在根本差异,且不同蛋白质和同一蛋白质的不同区域对 indels 的耐受性各不相同。然而,通过相对简单的模型,将实验测量或计算预测的替换分数与蛋白质二级结构信息相结合,能够准确预测 indels 对蛋白质稳定性的影响。这一研究成果不仅为我们深入理解 indels 的作用机制提供了理论依据,还为预测其对蛋白质功能和疾病的影响提供了有效的工具,在蛋白质工程、疾病诊断和治疗等领域具有广阔的应用前景。同时,研究还揭示了插入可作为功能获得性表型的来源,为蛋白质进化和功能研究提供了新的视角。未来,进一步扩大深度插入缺失诱变的研究范围,探索其对更多分子和细胞表型的影响,将有助于我们更全面地认识蛋白质的奥秘,推动生命科学和健康医学领域的发展。
下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究
10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!
欢迎下载Twist《不断变化的CRISPR筛选格局》电子书
单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析
下载《细胞内蛋白质互作分析方法电子书》