可调突变窗口的连续定向超突变系统RESPECTevo实现高效蛋白质连续进化
《Nature Communications》:Continuous targeted hypermutation with a tunable mutation window
【字体:
大
中
小
】
时间:2025年11月26日
来源:Nature Communications 15.7
编辑推荐:
本文报道了一种名为RESPECTevo的新型定向体内超突变系统,通过利用大肠杆菌Cascade复合物的靶向灵活性和错配耐受性,实现了对用户定义的内源/异源DNA区域(最高~200 bp)的连续、高效超突变。该系统可精确调控突变窗口,支持双区域同时超突变,为蛋白质连续进化提供了强大平台,显著提升了生物分子功能优化的效率和规模。
在生物技术领域,如何快速优化蛋白质功能是一个核心挑战。传统定向进化方法通常需要在体外引入突变,然后通过转化将突变文库导入细胞,这个过程不仅效率低,而且文库规模受限于转化效率,难以深入探索巨大的蛋白质序列空间。自然界中,抗体亲和力成熟过程给我们上了生动的一课:免疫系统通过体细胞超突变(Somatic Hypermutation, SHM)机制,优先在抗体互补性决定区(Complementarity-Determining Regions, CDRs)这一小段关键区域内引入高频突变,从而高效地筛选出高亲和力抗体。能否在实验室中模拟这种精准的靶向突变策略,开发出能够在小范围特定DNA区域内高效引入突变的工具,成为了连续定向进化领域亟待突破的难题。
尽管已有一些体内超突变方法被开发出来,如利用T7 RNA聚合酶-脱氨酶融合体的进化系统,或使用易错正交DNA聚合酶的系统,但它们往往无法实现对特定基因内小范围区域的精准靶向。虽然CRISPR-Cas9系统被尝试用于靶向诱变,但其有效突变范围通常局限于向导RNA结合位点附近。目前,能够像SHM那样精确控制突变范围(例如~200 bp)、可灵活调整靶向区域、并支持连续进化的分子工具仍然缺乏。
为了解决这一挑战,发表在《Nature Communications》上的这项研究提出了RESPECTevo(REgion SPECific Tool for continuous evolution)系统。该研究利用大肠杆菌I-E型CRISPR-Cas系统中的Cascade(也称为CRISPR相关复合物抗病毒防御,CasA,B,C,D,E)复合物的独特特性——其靶向长度可灵活调节(通过改变crRNA的间隔序列长度实现)以及一定的序列错配耐受性。研究人员设计了一种突变器,将核苷脱氨酶(如PmCDA1, rAPOBEC-1, TadA-8e, TadDE)与Cascade复合物的一个亚基(Cas11或Cas7)融合。当Cascade复合物在crRNA引导下与靶DNA结合形成R环(R-loop)时,融合的脱氨酶能够接近暴露的单链DNA区域,从而在用户预先定义的特定区域内高效引入点突变。这种设计巧妙地模拟了SHM的核心策略:将突变能量集中于功能关键且序列空间相对较小的区域,从而大幅提升进化效率。
为开展本研究,作者主要应用了几项关键技术:1) 利用大肠杆菌Cascade复合物的可编程DNA靶向能力及其对长链crRNA(间隔序列长度可达417核苷酸)的适应性,通过改变crRNA间隔序列长度来调节突变窗口大小;2) 构建了多种脱氨酶-连接子-Cas蛋白融合的突变器(如PmCDA_L16_Cas11_UGI, TadDE_L16_Cas11_UGI),并系统评估其突变效率和特异性;3) 使用基于高通量测序的靶向扩增子测序(Targeted Amplicon Sequencing)和全基因组测序(Whole-Genome Sequencing)精确量化突变频率和分布,并评估脱靶效应;4) 建立了基于条件毒性基因(pheS*)和抗生素抗性(如甲氧苄啶Trimethoprim, TMP)的体内选择系统,用于连续进化实验和功能验证。实验所用菌株主要为大肠杆菌K-12 W3110及其衍生株。
研究人员首先构建了初始突变器PmCDA_L16_Cas11_UGI,它融合了柳叶鱼胞苷脱氨酶1(Petromyzon marinus CDA1, PmCDA)、16个氨基酸的柔性连接肽(L16)、Cas11蛋白以及尿嘧啶糖基化酶抑制剂(Uracil glycosylase inhibitor, UGI)。实验系统包含四个质粒,分别用于诱导表达Cascade蛋白、crRNA、突变器和靶基因(本研究中最初使用了一个携带条件致死突变pheS_A294G (pheS)的质粒)。通过八个突变循环(每个循环约24小时,包括诱导突变和恢复生长阶段),他们观察到靶基因(pheS_codon)的抑制子频率随着循环次数增加而上升。高通量测序分析证实,突变(主要是C-to-T)高度富集在crRNA指定的105核苷酸区域内的非靶链(bottom strand)上,突变频率显著高于非靶向区域或靶链(top strand),证明了RESPECTevo能够实现高度特异性的靶向超突变。
为了提升突变效率并拓展突变谱,研究人员测试了不同脱氨酶(PmCDA, rAPOBEC-1, TadA-8e, TadDE)、连接子长度(L16, L32, L64)以及融合的Cas蛋白(Cas11, Cas7)。发现含有TadA-8e的变体细胞毒性较高。最终,含有双功能脱氨酶TadDE的变体TadDE_L16_Cas11_UGI因其能同时引入C-to-T和A-to-G突变(在靶区域总体突变频率达到1.5 x 10-3 每碱基每天),且突变分布相对均匀,被选为最优突变器,并命名为RESPECTevo。实验还表明,与不融合Cas11的TadDE_UGI相比,RESPECTevo(TadDE_L16_Cas11_UGI)的靶向效率高出5倍以上,证明了Cas11融合对于精准靶向的重要性。
利用Cascade复合物可适应不同长度crRNA间隔序列的特性,研究人员使用了11种间隔序列长度从33核苷酸到417核苷酸不等的crRNA。结果表明,RESPECTevo能够成功地将超突变限制在crRNA所定义的区域内。当crRNA间隔序列长度达到约177核苷酸时,仍能维持较高的平均C-to-T突变频率(超过10-2),而更长的间隔序列通常会导致突变效率下降。这表明RESPECTevo可以有效调控超突变范围,最大有效靶向范围可达约177 bp(加上PAM远端约20 bp的不稳定区域)。在另一个靶位点的验证实验也支持了这一结论。
为了测试RESPECTevo在靶DNA序列发生突变后是否仍能继续发挥作用,研究人员在crRNA中引入了单个或多个错配。令人惊讶的是,即使在crRNA间隔序列的种子区域(seed region, +4位点)或中间区域引入连续6个错配,超突变效率的下降幅度也小于3倍,并且仍显著高于无crRNA的对照组。这表明RESPECTevo对少量错配具有鲁棒性,有利于在靶向区域内连续引入多个突变。
研究人员设计了靶向大肠杆菌染色体lacZ基因不同位置的crRNA(包括重叠或相邻的靶点,以及相距超过2600 bp的远端靶点)。结果表明,同时表达两个crRNA(如B1-B3, B1-T1, B2-T1)能够在不显著相互干扰的情况下,在相应的两个靶向区域同时引发高效超突变。对于相距遥远的两个靶点(B1和B5),突变也仅特异性地富集在这两个区域。这证明了RESPECTevo具备高度特异性的多靶点超突变能力。
通过使用靶向不同基因(质粒上的pheS*_codon、染色体上的lacZ或rpoB)的crRNA进行正交验证(PCPA计数选择和利福平抗性实验),以及全基因组测序分析,结果表明RESPECTevo在预期靶位点之外产生的脱靶突变非常有限,显示出高度的特异性。
通过多靶向快速进化大肠杆菌二氢叶酸还原酶(ecDHFR)
为了展示RESPECTevo在蛋白质功能进化中的应用潜力,研究人员选择大肠杆菌二氢叶酸还原酶(dihydrofolate reductase, ecDHFR)作为模型蛋白。该酶是叶酸代谢的关键酶,其抑制剂甲氧苄啶(Trimethoprim, TMP)的抗性通常需要多个远距离位点的突变。他们设计了两条crRNA(crRNA1和crRNA2,间隔序列长度分别为129 nt和57 nt),分别靶向ecDHFR编码基因folA中围绕配体结合接口的两个不同区域。经过三轮TMP选择压力下的连续进化,同时表达两条crRNA的细胞表现出比只表达单条crRNA的细胞更高的TMP抗性,显示了双区域超变的协同效应。对筛选出的抗性菌株进行测序,发现突变主要集中在两个crRNA指定的靶向区域内,并且引入了诸如A29T, W30Q, G51S, V88A等新的(除A26T和W30R外)可能贡献于TMP抗性的突变。将筛选出的folA突变体导入低拷贝质粒进行验证,证实这些变异体对TMP的半数抑制浓度(IC50)比野生型提高了超过1800倍。
本研究受抗体亲和力成熟的启发,开发了RESPECTevo这一新型靶向体内超突变系统。它巧妙地利用了大肠杆菌Cascade复合物的可编程性、靶向范围可调性以及错配耐受性,实现了对用户定义的、最长约200 bp的基因组区域进行连续、高效、特异的超突变。其主要优势包括:精确控制靶向范围、可靶向内源DNA、对错配的耐受性支持连续突变、可同时靶向多个区域,以及高达1.5 x 10-3 每碱基每天的突变频率。
与需要反复进行体外操作(如易错PCR、CRISPR饱和突变)的传统定向进化方法相比,RESPECTevo实现了真正的连续定向进化,避免了克隆和转化步骤带来的库容量限制,能够更深入、更广泛地探索蛋白质功能空间。虽然RESPECTevo与碱基编辑器(Base Editors)都使用CRISPR系统和脱氨酶,但前者旨在均匀地超突变一个相对较大且可调的区域,适用于连续进化;而后者则专注于在极窄窗口内(通常2-8 bp)实现精确的碱基替换。
研究也指出,使用更长的crRNA时突变效率会下降,其具体机制(如Cascade复合物组装效率或与DNA结合亲和力的变化)仍有待进一步阐明。尽管RESPECTevo目前在大肠杆菌中开发,但考虑到I-E型Cascade系统已在酵母和哺乳动物细胞中成功应用,未来将其拓展至其他生物体系具有潜力。
总之,RESPECTevo为蛋白质的快速、连续进化提供了一个强大而灵活的平台,特别适用于优化蛋白质-配体和蛋白质-蛋白质相互作用,在生物技术、合成生物学和药物开发等领域具有广阔的应用前景。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号