结构生物学助力变异解读:两项研究带来的新视角与实践

《AJHG》:Structural biology in variant interpretation: Perspectives and practices from two studies

【字体: 时间:2025年04月15日 来源:AJHG 9.8

编辑推荐:

  为解决变异解读中难以全面考量蛋白质折叠稳定性等问题,研究人员开展了将结构生物学应用于 TP53 和 BRCA1 基因变异解读的研究。结果显示整合结构证据和现代计算机工具可提升预测准确性。这为精准变异解读提供新策略,推动临床应用。

  在生命科学领域,基因变异与疾病的关联研究一直是热点。随着基因测序技术的飞速发展,越来越多的基因变异被发现,但如何准确解读这些变异对人体健康的影响,却成为了一个棘手的问题。传统的变异解读往往聚焦于 DNA 和 mRNA 水平,然而,当 mRNA 转录本不会被无义介导的降解(NMD)时,遗传改变的影响最终会体现在蛋白质层面,包括蛋白质的序列、折叠和结构变化。这就如同建造一座大厦,DNA 是大厦的设计蓝图,mRNA 是施工图纸,而蛋白质则是大厦的实际建筑材料,其结构和功能的改变直接关系到大厦的稳定性和实用性。
目前,美国医学遗传学与基因组学学院(ACMG)和分子病理学协会(AMP)制定的变异评估指南,虽然在一定程度上考虑了蛋白质结构相关因素,如关键功能域等,但对于基于复杂三维(3D)结构特征的直接结构分析应用较少。而近年来深度学习方法在预测蛋白质 3D 结构方面取得了重大突破,如 AlphaFold 等工具的出现,理论上可覆盖整个人类蛋白质组的结构预测,这为变异解读带来了新的机遇,但同时其复杂性和局限性也有待更多研究人员深入了解。

为了更好地利用结构生物学信息提升变异解读的准确性,来自美国 Ambry Genetics 的研究人员 Matthew J. Varga、Marcy E. Richardson 和 Adam Chamberlin 等开展了相关研究。他们通过分析两篇发表于《美国人类遗传学杂志(The American Journal of Human Genetics,AJHG)》的文章,深入探讨了结构生物学在变异解读中的应用。

研究人员在研究过程中运用了多种关键技术方法。在蛋白质结构获取方面,对于有实验解析结构的,优先从蛋白质数据库(PDB)获取,如利用 X 射线晶体学、核磁共振(NMR)、冷冻电镜(cryo - EM)等实验方法得到的结构;对于无实验结构的蛋白质,则采用同源建模或基于机器学习的从头建模方法,如 AlphaFold2 等工具进行结构预测。在评估变异对蛋白质稳定性影响时,使用 FoldX 计算吉布斯自由能变化(ΔΔG)。同时,利用多种计算机预测工具,如 AlphaMissense、BayesDel、Align - GVGD 等,结合蛋白质结构特征进行变异致病性预测。

选择正确蛋白质模型的重要性:蛋白质结构的选择是变异评估的关键。实验测定蛋白质结构的方法各有优劣。X 射线晶体学可获得高分辨率结构,是行业标准;NMR 能提供蛋白质在溶液状态下的构象集合,有助于研究蛋白质动力学,但分辨率和蛋白质大小受限;cryo - EM 更易获取大蛋白和复合物的结构,不过以往分辨率较低,目前随着技术进步有所改善。在实际应用中,X 射线晶体学解析的结构因高分辨率成为首选,高质量 cryo - EM 结构次之。当缺乏实验结构时,可通过同源建模构建模型,但天然结构优先于同源模型。新兴的基于机器学习的从头建模工具,如 AlphaFold2 等,在变异解读中展现出一定潜力,尤其是在无实验结构的情况下,但高质量实验结构和模型在计算稳定性指标方面仍更具优势。

确定稳定性指标:蛋白质稳定性是评估变异致病性的重要指标。稳定性指蛋白质维持对应天然结构构象的能力,这对于由功能丧失驱动的基因 - 疾病关系研究尤为重要。蛋白质失去天然结构通常会导致功能丧失,而变异也可能使蛋白质结构过于稳定,影响其活性构象的形成或使其持续处于某种构象,从而产生功能获得或功能丧失的效果。通过计算 ΔΔG 来衡量氨基酸变异对蛋白质稳定性的影响,正值表示不稳定,负值表示稳定。目前预测蛋白质稳定性变化的工具不断改进,FoldX 是行业内预测蛋白质稳定性的 “金标准” 工具,但结合其他生物物理信息,如将目标变异的计算能量与已知分类的附近变异能量进行比较,可提高预测准确性。

使用计算机预测工具:在变异评估中,计算机预测工具发挥着重要作用。一类是主要基于一维序列信息预测变异致病性的工具,如 SIFT、BayesDel、REVEL 等,这些工具性能差异较大,校准算法对于提高预测准确性至关重要。另一类是结合蛋白质结构特征的预测工具,如 SNAP2 可预测局部结构特征,PolyPhen - 2、PopMusic、DUET 等则明确使用蛋白质结构信息。近年来,将 AlphaFold 预测结构融入的 AlphaMissense 等工具,在预测变异致病性方面表现出很大潜力,能够高通量地解释或预测变异对天然蛋白质功能的影响,而这些影响通过实验测定往往不切实际或难以实现。

基于氨基酸位置的筛选:蛋白质结构特征对变异影响评估具有重要意义。Rotenberg 等人和 Ramadane - Morchadi 等人的研究重点关注了蛋白质结构的两个方面,即内在有序 / 无序性和相对溶剂可及表面积(RSA)。内在有序 / 无序性指含有变异的蛋白质区域是否折叠成有序的二级结构;RSA 用于衡量变异位点是埋藏在蛋白质内部还是暴露在溶剂中,埋藏位点的变异更可能导致结构不稳定。然而,基于内在无序和溶剂可及性的筛选存在局限性,人类基因组中超过 40% 的蛋白质含有大的无序区域,这些区域缺乏固定的 3D 坐标,变异对其稳定性的影响难以计算和解读。使用 IUPred2A 等工具预测无序区域,可帮助评估有序区域变异的功能影响,过滤掉无序区域能提高计算蛋白质去稳定化能量的预测能力。

两项研究的视角:Rotenberg 等人的研究聚焦于 TP53 基因编码的 p53 蛋白,该基因与李 - 弗劳梅尼综合征(Li - Fraumeni syndrome)相关,这是一种遗传性癌症易感综合征,TP53 致病性变异的外显率高,准确分类变异至关重要。研究人员整合结构生物学信息(ΔΔG 分数)、AlphaMissense 和当前 TP53 变异管理专家小组(VCEP)使用的计算机工具,评估其对预测能力的影响。结果表明,整合 ΔΔG 分数可增强对错义变异评估的特异性和证据强度,尤其是对埋藏残基的变异;对于单氨基酸缺失,ΔΔG 分数在埋藏残基中的表现优于 BayesDel。基于此,研究提出了针对 TP53 变异的最佳 ΔΔG 截断分数和修订的生物信息学预测框架。

Ramadane - Morchadi 等人的研究则针对 BRCA1 基因的错义替代变异分类挑战展开。在 ACMG/AMP 指南框架下,对于罕见错义变异,仅依靠序列保守性和计算证据代码进行分类存在局限性。研究评估了基于结构的证据,包括 RSA、折叠稳定性(ΔΔG)和 AlphaMissense 致病性分数在 BRCA1 错义变异分类计算预测中的应用。结果显示,AlphaMissense 在预测性能上优于 ΔΔG 和 BayesDel,且 AlphaFold2 生成的模型用于 FoldX 计算 ΔΔG 的质量足够。此外,研究强调 RSA 在评估过程中起着关键作用,结合 AlphaMissense 和 ΔΔG 分数可提高对 BRCA1 错义变异致病性和良性评估的准确性和特异性。

研究结论表明,结构生物学为变异解读提供了重要的补充证据,有助于深入理解遗传变异对蛋白质结构和功能的影响。整合蛋白质折叠稳定性指标和现代计算机工具,如 AlphaMissense,可显著提升变异影响预测的准确性。这不仅改进了变异分类的精细度和特异性,还为意义不明的变异提供了更多的机制解释。然而,目前的研究也存在一定局限性,如评估多基于蛋白质功能数据而非最终临床解释,计算机工具和结构预测信息存在重叠等问题。未来随着计算工具的不断发展,需要进一步明确这些工具的特点和局限性,推动结构生物学在变异解读中的更广泛应用,为临床诊断和个性化治疗提供更精准的依据。

涓嬭浇瀹夋嵎浼︾數瀛愪功銆婇€氳繃缁嗚優浠h阿鎻ず鏂扮殑鑽墿闈剁偣銆嬫帰绱㈠浣曢€氳繃浠h阿鍒嗘瀽淇冭繘鎮ㄧ殑鑽墿鍙戠幇鐮旂┒

10x Genomics鏂板搧Visium HD 寮€鍚崟缁嗚優鍒嗚鲸鐜囩殑鍏ㄨ浆褰曠粍绌洪棿鍒嗘瀽锛�

娆㈣繋涓嬭浇Twist銆婁笉鏂彉鍖栫殑CRISPR绛涢€夋牸灞€銆嬬數瀛愪功

鍗曠粏鑳炴祴搴忓叆闂ㄥぇ璁插爞 - 娣卞叆浜嗚В浠庣涓€涓崟缁嗚優瀹為獙璁捐鍒版暟鎹川鎺т笌鍙鍖栬В鏋�

涓嬭浇銆婄粏鑳炲唴铔嬬櫧璐ㄤ簰浣滃垎鏋愭柟娉曠數瀛愪功銆�

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号