阶梯碰撞能量消除环状铵离子位置偏倚,提升蛋白质酰化鉴定精准度

《Communications Chemistry》:Stepped collisional energy improves protein acylation identification by eliminating positional bias of cyclic immonium ions

【字体: 时间:2025年12月10日 来源:Communications Chemistry 6.2

编辑推荐:

  本研究针对基于质谱的蛋白质组学鉴定赖氨酸酰化时环状铵离子(CycIm)生成效率存在位置偏倚的难题,系统揭示了其受修饰位点靠近肽段N端的“位置效应”。研究人员通过LysargiNase酶切、同位素标记合成肽及阶梯高能碰撞解离(stepped HCD)策略,证实该效应源于b型碎片离子的不稳定性,并建立了可同时实现高序列覆盖度(~87%)和近定量CycIm离子检测率(~99%)的优化方案,显著提升了酰化鉴定的深度、可靠性及分析速度。

  
在生命活动的精密调控网络中,蛋白质扮演着核心角色,而其功能的多样性与精确性,很大程度上受到一种称为“翻译后修饰”(Post-Translational Modification, PTM)的化学修饰的调控。赖氨酸酰化(Lysine Acylation)是其中一类至关重要且种类繁多的PTM,通过在赖氨酸残基上共价连接不同的酰基基团(如乙酰基、琥珀酰基、乳酸酰基等),动态地改变蛋白质的电荷、构象、稳定性及相互作用,从而广泛参与表观遗传调控、代谢调控、细胞信号转导等关键生物学过程。质谱(Mass Spectrometry, MS)技术,特别是基于“自下而上”(bottom-up)的蛋白质组学策略,已成为大规模发现和鉴定蛋白质赖氨酸酰化位点的强大工具。其原理在于,每种酰化修饰都会给赖氨酸残基带来一个特异性的质量偏移,通过高精度质谱仪检测酶解后肽段的质荷比变化,即可实现对修饰的无偏鉴定。
然而,一个长期存在的挑战在于如何高置信度地确定修饰发生的精确位点。这时,一类被称为“诊断离子”(diagnostic ions)的碎片离子就显得尤为重要。例如,对于酰化赖氨酸,其特有的环状铵离子(Cyclic Immonium ion, CycIm)在串联质谱(MS/MS)图中出现,就如同给该修饰贴上了“身份证”,能极大提高鉴定结果的可靠性。尽管这些诊断离子的价值已被认可,但一个根本性问题悬而未决:是否所有含有修饰的肽段都能均等地产生这些诊断离子?其生成效率是否受到肽段序列背景、修饰位置或碎裂能量等条件的制约?对这一问题的模糊认知,限制了诊断离子在蛋白质组学中的普适性应用。
发表在《Communications Chemistry》的这项研究,正是为了系统解答上述问题。研究人员首先对六种常见且重要的天然赖氨酸酰化(乙酰化、乳酸酰化、琥珀酰化、甲基丙烯酰化、2-羟基异丁酰化和丙二酰化)进行了深入分析。他们发现了一个惊人且一致的规律:环状铵离子(CycIm)的生成存在强烈的“位置效应”(position effect)。具体而言,当酰化修饰的赖氨酸位于肽段的N端附近时,其对应的CycIm离子不仅检测频率高,信号强度也显著更强;反之,当修饰位点靠近C端时,CycIm离子的生成效率则大幅下降。这一现象在所有分析的六种修饰类型中都得到了验证,暗示其可能是肽段碎裂过程中的一个普遍特性。
为了确认该效应的普遍性,研究团队将分析范围扩展到人工诱导的酰化(如丙酰化、DSS/BS2G单链接)、稳定同位素标记(SILAC, D4)的定量蛋白质组学数据,甚至其他氨基酸的线性铵离子(LinIm,如组氨酸、色氨酸、苯丙氨酸、酪氨酸)以及永久性PTM(如羧氨基甲基化半胱氨酸、磷酸化酪氨酸)。结果一致显示,这种N端优势的位置效应普遍存在,与具体的氨基酸类型或修饰种类无关。
为了在严格控制变量的条件下直接验证位置效应,研究人员巧妙地合成了含有两个赖氨酸残基的模型肽,并利用轻重同位素标记(如BS2G-d0和BS2G-d4)分别对位于不同位置(N端、中间、C端)的赖氨酸进行特异性酰化(如戊二酰化)。这样,在一次MS/MS扫描中,就可以直接比较来自同一肽段内不同位置修饰的CycIm离子强度。实验结果提供了确凿的证据:无论肽段长度如何,靠近N端的修饰所产生的CycIm离子强度总是远高于靠近C端的修饰,有时强度差异可达数十倍。通过交换轻重标记的位置,他们进一步排除了同位素标记本身可能带来的偏差。
那么,是什么机制驱动了这种位置效应呢?研究人员提出了一个“b离子不稳定性”(b-ion instability)假说。在常规的碰撞诱导解离(CID)或高能碰撞解离(HCD)中,b型碎片离子通常不如y型离子稳定。当一个修饰位于N端时,它会包含在多个连续的b离子(b2, b3, b4...)中,每个b离子碎裂时都有可能产生CycIm离子,从而提高了总体观测概率。而C端的修饰则仅包含在少数b离子中,机会自然减少。为了验证这一假说,他们使用LysargiNase进行蛋白质酶切。LysargiNase能在肽段N端产生一个带正电荷的精氨酸或赖氨酸残基,这种电荷远离N端的结构被认为能稳定b离子。果不其然,在LysargiNase酶切产生的肽段中,位置效应发生了“反转”:此时,CycIm离子的生成效率随着修饰位点向C端移动而显著增加。使用经过设计、N端带精氨酸的合成肽进行的实验也完美复现了这一反转现象,为b离子不稳定性假说提供了强有力的支持。
鉴于CycIm离子作为诊断标记的重要性,如何优化其检测成为一个关键问题。研究人员发现,提高碰撞能量(NCE)能显著增强CycIm离子的产率,但过高的能量又会损害用于肽段序列鉴定的b/y离子,导致序列覆盖度下降。面对这一两难选择,他们评估并最终推荐使用“阶梯HCD”(stepped HCD)策略,即在一次MS/MS扫描中应用多个不同的碰撞能量。结果表明,诸如30-39%或27-42%的阶梯能量组合,能够巧妙地兼顾两方面需求:既保持了中等能量下获得的高序列覆盖度,又实现了高能量下才能达到的近乎定量的CycIm离子检测率(~99%)。这种优化的碎裂策略不仅提升了肽段鉴定的质量,还使得鉴定到的独特酰化肽段数量增加了约15%。
最后,研究团队将阶梯HCD策略应用于复杂细胞蛋白质组中内源性乳酸酰化(lactylation)的分析。这一实际应用充分展示了该方法的优越性:在提升肽段序列覆盖度(89% vs 80%)的同时,将诊断性CycIm离子的检测率提高到超过99%。尤其对于以往难以产生诊断离子的C端修饰肽段,其检测率从仅80%大幅提升至近乎定量水平(99%),从而使得鉴定到的独特乳酸酰化肽段数量翻了一倍多。此外,近乎恒定的CycIm离子信号使得研究人员能够利用其作为“预过滤器”,仅对包含该诊断离子的谱图进行数据库检索,这使需要处理的谱图数量和搜索时间减少了约40%,同时保留了98.2%的原始鉴定结果,极大地缓解了高通量蛋白质组学数据分析的计算负担。
关键实验方法概述
本研究综合利用了生物信息学分析、化学合成肽段、细胞模型以及先进的质谱技术。关键方法包括:1) 对大量公共及自产蛋白质组学数据集进行生物信息学再分析,系统评估CycIm/LinIm离子的位置效应;2) 设计并合成含有轻重同位素标记赖氨酸的模型肽,通过NHS酯化学或酶促反应实现特异性酰化,用于机制验证;3) 使用LysargiNase替代胰蛋白酶进行酶切,以改变肽段N端性质,探究b离子稳定性对位置效应的影响;4) 在Orbitrap Eclipse质谱仪上采用数据依赖采集(DDA)模式,系统比较不同固定碰撞能量(NCE)和阶梯碰撞能量(stepped HCD,如27-42%)对肽段序列覆盖度和诊断离子产率的影响;5) 从HuH-7细胞中提取蛋白质,通过抗体免疫沉淀(IP)富集内源性乳酸酰化肽段,用于验证阶梯HCD策略的实际应用效果。
研究结果详述
不同天然赖氨酸酰化中普遍存在显著的位置效应
研究人员首先验证了所选六种赖氨酸酰化(乙酰化、乳酸酰化、琥珀酰化、甲基丙烯酰化、β-羟基丁酰化、丙二酰化)对应的CycIm离子作为诊断标记的特异性,确认其在修饰肽段中的检测比例和强度均显著高于非修饰肽段。随后,他们将肽段按修饰赖氨酸的位置分为N端、中间和C端三个区域进行分析。结果发现,所有六种修饰都表现出强烈的“位置效应”:CycIm离子的检测频率和相对强度均随着修饰位点从N端向C端移动而逐渐降低。例如,对于乙酰化,CycIm离子在N端区域的检测比例为93%,中部分为90.6%,而到C端区域则降至79.3%;其相对强度中位数也从N端的1.72降至C端的0.58。其他五种修饰也呈现出完全一致的趋势,表明位置效应是这些酰化残基碎裂过程中的一个基本特征。
位置效应是铵离子形成的普遍规律
为了确认位置效应不仅存在于内源性修饰,研究团队进一步分析了人工诱导的赖氨酸酰化数据集(如通过NHS酯化学产生的丙酰化,以及交联剂DSS和BS2G的单链接产物)。结果显示,这三种人工修饰的特征性CycIm离子同样表现出强烈的依赖于位置的趋势。接着,他们分析了稳定同位素标记(SILAC标记的乙酰化、乳酸酰化数据集和D4标记的戊二酰化数据集)的定量蛋白质组学数据。正如理论预测,他们检测到了质量相应增加(SILAC +6/5 Da, D4+4 Da)的CycIm离子,并且这些质量偏移的CycIm离子也清晰地显示出位置效应。最后,研究扩展到其他氨基酸残基及其修饰产生的线性铵离子(LinIm),包括未修饰的组氨酸(H)、色氨酸(W)、苯丙氨酸(F)、酪氨酸(Y),以及永久性PTM如羧氨基甲基化半胱氨酸(Cys-CAM)和磷酸化酪氨酸(pY)。分析表明,这些LinIm离子的生成效率(频率和强度)也随着残基位置向C端移动而显著降低。这些综合证据强有力地支持了位置效应是控制铵型碎片离子形成的一个普遍规律,独立于具体的氨基酸或修饰类型。
使用同位素标记合成肽直接验证位置效应
为了在严格控制肽段序列背景和仪器响应等变量的情况下明确证实位置效应,研究人员设计了一个决定性的实验:合成在特定位置包含两个赖氨酸残基的模型肽,并利用轻重同位素标记(D0和D4)的交联剂BS2G,选择性地对位于不同位置(如一个靠近N端,一个靠近中间或C端)的赖氨酸进行戊二酰化。这样,在同一张MS/MS谱图中可以直接比较来自不同位置修饰的CycIm离子强度(通过+4 Da的质量差区分)。实验结果提供了确凿的证据:在9个氨基酸的肽段SLK(D0-Glu)GK(D4-Glu)AEVR中,位于第3位(N端区域)的K-Glu产生的CycIm离子强度比位于第5位(中间区域)的K-Glu强约28倍。在更长的12肽和15肽中,也观察到靠近N端的修饰产生的CycIm离子强度显著高于靠近C端的修饰。通过交换轻重标记位置的对照实验,排除了同位素标记本身引入偏差的可能性。此外,使用含有SILAC标记赖氨酸的肽段进行丙酰化、乳酸酰化和戊二酰化实验,也进一步证实了位置效应适用于带有不同电荷特性酰基的修饰。
通过调节B离子稳定性逆转位置效应
为了阐明位置效应的机制,研究人员提出了“b离子不稳定性”假说。他们推测,由于在常规HCD谱图中b离子通常不稳定且丰度较低,位于N端的修饰有更多机会被包含在多个b离子前体中(b2, b3, b4等),每个b离子碎裂都可能产生CycIm离子;而C端修饰则包含在较少的b离子中。为了验证这一假说,他们利用LysargiNase进行酶切,该方法通过在肽段N端引入一个远离电荷的碱性残基(精氨酸或赖氨酸)来增强b离子的稳定性。正如预期,LysargiNase酶切显著提高了b离子的覆盖度。引人注目的是,当重新分析这些LysargiNase产生的肽段时,位置效应发生了完全的“逆转”:对于所有测试的铵离子(戊二酰化的CycIm离子,以及H, W, F, Y和Cys-CAM的LinIm离子),其生成效率(检测比例和强度)现在转变为随着残基位置向C端移动而增加。例如,对于戊二酰化,检测比例从N端的55%激增至C端的92%,强度中位数也增加了三倍。为了提供这一逆转的决定性证据,他们重新合成了模型肽,将精氨酸残基从C端移至N端以模拟LysargiNase的产物。比率分析结果与统计数据完全一致:在所有测试的肽段中,位于更靠近C端的修饰产生的CycIm离子信号强度远高于位于N端附近的修饰。类似的对照实验(交换同位素标记、测试其他酰化)进一步证实了这种由N端精氨酸驱动的效应逆转的普遍性。这些结果表明b离子不稳定性可能是位置效应的主要机制驱动因素。
阶梯HCD实现高序列覆盖度和稳健的CycIm离子检测
鉴于CycIm离子的诊断重要性,研究人员试图优化其检测策略。他们假设更高的碰撞能量有利于CycIm离子的形成,但这可能与产生序列信息(b/y离子)所需的最佳能量相冲突。为了系统表征这种权衡,他们实施了一个多级碎裂策略:首先在固定碰撞能量(NCE 35%)下触发MS/MS扫描,如果检测到戊二酰化赖氨酸的特异性CycIm离子(m/z 198.1132),则自动触发在多个不同NCE(21%至39%)下的第二次高分辨率MS/MS扫描。分析表明,肽段序列覆盖度在NCE 30%左右达到峰值,然后在更高能量下下降;而CycIm离子的检测率则随着NCE的增加从36%持续上升至96%,证实了单一NCE设置无法兼顾两者。随后,他们评估了阶梯HCD作为解决方案。结果表明,诸如30-39%和27-42%的阶梯NCE组合,成功地结合了中等能量扫描的高序列覆盖度和高能量扫描的高CycIm离子检测率与强度的优点。这种优化的碎裂策略使肽段序列覆盖度从72%提升至87%,并使得鉴定到的独特戊二酰化肽段数量增加了约15%。因此,阶梯HCD被证明是用于修饰肽段分析的优越采集策略,能有效克服单一能量碎裂的固有矛盾。
阶梯HCD改进蛋白质乳酸酰化的鉴定
作为一个近年兴起的PTM,蛋白质乳酸酰化(lactylation)在连接代谢状态(如糖酵解活性)与蛋白质功能调控方面显示出重要作用。为了展示阶梯HCD策略的实际效用和稳健性,研究团队将其应用于复杂细胞蛋白质组中内源性乳酸酰化的分析。这一应用取得了显著且多方面的改进:该方法在提高肽段序列覆盖度(89% vs 80%)的同时,更关键地将诊断性CycIm离子的检测率提升至99%以上。这种改进对于C端修饰的肽段尤为显著,其检测率从仅80%飙升至近乎定量的水平(99%)。更优的碎裂质量直接转化为独特乳酸酰化肽段鉴定数量超过100%的增长,实现了对乳酸化修饰组(lactylome)更全面的表征。此外,CycIm离子的高保真度和近乎普遍的检测率使得一种强大的预过滤策略成为可能:通过选择性处理仅包含该诊断离子的谱图,实现了谱图数量和数据库搜索时间减少约40%,同时保留了98.2%的原始鉴定结果,直接应对了高通量蛋白质组学日益增长的计算负担。
结论与意义
本研究系统揭示并验证了质谱碎裂中铵离子(包括CycIm和LinIm)生成存在普遍的“位置效应”,其核心机制与b型碎片离子的稳定性密切相关。通过将这一基础理论认知转化为优化的数据采集方法——阶梯HCD,研究团队成功解决了在单次碎裂事件中同时获得高质量肽段序列信息和稳健诊断离子信号的难题。该方法不仅显著提升了赖氨酸酰化鉴定的深度、可靠性和效率,其核心原理(兼顾序列与诊断离子采集)也具有广泛的适用性,可推广至其他类型的PTM分析(如糖基化、交联质谱等)。此外,近乎定量的诊断离子产率为开发更高效的计算过滤流程和更高置信度的评分算法奠定了基础。这项工作深化了我们对肽段气相碎裂行为的理解,并为更灵敏、准确和高通量的蛋白质组表征开辟了新途径。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号