1. 引言
损伤诱导 G(DinG)样蛋白属于超家族 2(SF2)DNA 解旋酶,具有 5′–3′单向单链 DNA(ssDNA)易位活性。该蛋白家族通常有四个结构域,包括两个解旋酶马达结构域(MD1 和 MD2)、铁硫簇结合(FeS)结构域和 Arch 结构域。
大肠杆菌(Escherichia coli)的 DinG(EcDinG)是 DinG 样家族的首个成员,其表达受 SOS 系统调控,在 DNA 修复中起重要作用,但具体功能尚未完全明确。另一种大肠杆菌中的 DinG 样蛋白 YoaA 也受 SOS 反应调节,它与 DNA 聚合酶 III 全酶的 chi 亚基 HolC 相互作用,在 DNA 修复中发挥独特作用。在一些细菌中,DinG 样蛋白失去 FeS 簇,获得额外的 N 端或 C 端延伸,参与成簇规律间隔短回文重复(CRISPR)系统。目前,仅有EcDinG 和铜绿假单胞菌(Pseudomonas aeruginosa)的一种 CRISPR 相关 DinG 样蛋白有结构信息。
本文对细菌 DinG 样蛋白进行系统分类,通过序列比对、结构比较和功能分析,结合现有文献和结构预测,全面研究这类蛋白。
2. 细菌中 DinG 样蛋白的分布与进化
为研究 DinG 样蛋白在细菌中的系统发育分布和进化轨迹,研究人员以EcDinG 的蛋白序列为查询序列,在京都基因与基因组百科全书(KEGG)数据库中进行同源性搜索,设定 E 值阈值为 1e - 5 ,选取代表性菌株。利用 Clustal Omega 进行多序列比对和系统发育树构建,并用 ChiPlot 进行可视化和注释。
在分析的 192 个细菌目中,125 个含有 DinG 样同源物。根据结构域架构和预测功能,这些蛋白被分为十个亚组:DinG、YoaA、CasDinG、CasDinG - HNH、ExoDinG、pExoDinG、EndoDinG、RadC 样 DinG、sDinG(短型 DinG)以及其他无法归类的单独同源物。
DinG 样蛋白普遍含有保守的 MD1 和 MD2 解旋酶马达结构域以及 Arch 结构域,多数还具有 FeS 结构域,其特征性的 CCCC 基序用于协调 [4Fe - 4S] 簇。部分变体的基序如 CCHC 或 CCCS,也可能保留结合 FeS 簇的能力。研究中,将能结合 FeS 簇的结构域称为 FeS 结构域,无法结合的称为 pFeS 结构域,后者存在于 CasDinG、CasDinG - HNH 亚组及部分 ExoDinG 蛋白中,sDinG 亚组则完全缺乏 FeS 和 pFeS 结构域。
3. DinG 样亚组的特征
3.1. DinG
dinG基因在经丝裂霉素 C(MMC)处理的大肠杆菌细胞中,通过测量半乳糖激酶基因融合的转录激活而被首次鉴定。它是 LexA 调节的 SOS 调节子基因,在细菌 SOS 反应中,LexA 自我降解,解除对dinG表达的抑制。
敲除大肠杆菌中的dinG基因不会导致严重表型,说明其对细胞生存非必需。DinG 参与解决 R 环、置换 RNA 聚合酶,促进高转录基因组区域的复制,可能与其他 DNA 解旋酶(如 Rep 和 UvrD)合作。在脑膜炎奈瑟菌(Neisseria meningitidis)中,dinG缺失会影响细菌对特定 DNA 损伤剂的敏感性,且可能参与代谢途径的调节。
生化研究表明,DinG 可解旋多种 DNA 结构,如悬突、瓣状结构、叉状结构、D 环、R 环和 G - 四链体(G4)DNA 等,且大肠杆菌和脑膜炎奈瑟菌的单链 DNA 结合蛋白(SSB)可增强其解旋酶活性。
目前仅对EcDinG 进行了详细的结构表征,它由 MD1、MD2、Arch 和 FeS 四个结构域组成。EcDinG 通过 MD1 和 MD2 表面的凹槽与 ssDNA 相互作用,其 [4Fe - 4S] 簇在细胞条件下保持氧化还原活性,ATP 水解可增强 DNA 介导的氧化还原信号。EcDinG 的结构研究揭示了其 5′–3′ ssDNA 易位的 “尺蠖” 机制。此外,SSB 的 C 末端尾巴(SSB - Ct)对与 DinG 的结合至关重要,但其他 DinG 同源物与 SSB 的相互作用方式及该界面的进化保守性尚不清楚。
3.2. YoaA
YoaA 与 DinG 类似,在大肠杆菌中作为 LexA 调节的 SOS 反应的一部分,受 DNA 损伤诱导。目前尚无 YoaA 的结构信息,序列比对显示EcYoaA 与EcDinG 有相似的四结构域结构,但EcYoaA 的 MD2 结构域 C 末端多一个保守的 α 螺旋(α7)。
根据基因组共现分析和序列比对,确定了区分 YoaA 型亚组和 DinG 亚组的标准:MD2 结构域存在 α7 螺旋且基因组中存在 HolC 同源物。YoaA 同源物在 26 个细菌目中被鉴定出来,一些细菌同时含有 DinG 和 YoaA,表明它们在体内功能不同。
实验证明yoaA有助于细胞对复制抑制剂叠氮胸苷(AZT)的耐受性,EcYoaA 可促进复制过程中对 3′新生链的访问,减少 T - 到 - A 的颠换突变。YoaA、HolC 和 SSB 可形成多蛋白复合物,HolC 似乎能形成两种功能复合物:用于复制的 HolC - HolD 复合物和用于修复的 HolC - YoaA 复合物。
YoaA 单独在大肠杆菌 BL21 (DE3) 细胞中表达时溶解性差,与 HolC 共表达可改善这一情况。共纯化的 YoaA - HolC 复合物具有 DNA 依赖的 ATP 酶和解旋酶活性,优先解旋具有 3′和 5′单链悬突的叉状双链 DNA 以及含损伤的 DNA。序列分析和结构预测表明,YoaA 与 DinG 有相似的 DNA 解旋和易位机制,关键残基突变会消除 YoaA 对 AZT 的耐受性。
3.3. CasDinG
IV - A 型 CRISPR - Cas 系统中的 Csf4 蛋白,后被重新归类为 CRISPR 相关 DinG(CasDinG),因其与 DinG 解旋酶序列相似且在 CRISPR - Cas 途径中发挥功能。系统发育分析显示,CasDinG 序列形成一个独特的簇,表明其功能特化。
对P. aeruginosa的 CasDinG(PaCasDinG)的生化分析表明,它是一种 ATP 依赖的 5′–3′ DNA 易位酶,可解旋双链 DNA 和 RNA/DNA 杂交体。PaCasDinG 基因位于质粒上,在含有cas6、cas8、cas7、cas5和 CRISPR 阵列的操纵子上游,且方向相反。
PaCasDinG 与 Csf - crRNA - dsDNA 复合物结合的冷冻电镜结构显示,CasDinG 通过 MD1、MD2 和 Arch 结构域上的多个结合界面与 Cas7 的食指基序直接相互作用。推测 CasDinG 通过与非靶标链(NTS)和 Cas7 食指基序的相互作用被招募到 dsDNA 结合的 Csf 复合物上,沿 NTS 5′–3′方向滑动,解旋靶标 dsDNA,随后可能被未知的细胞核酸酶降解。
PaCasDinG 是唯一有实验解析结构的 CasDinG 蛋白,包含 MD1、MD2、Arch、pFeS 和 N 端结构域(NTD)五个结构域。其与 ssDNA 结合的结构表明,MD1 和 MD2 均参与 ssDNA 结合,关键 DNA 结合和 ATP 酶残基高度保守。ATP 结合位点突变(K136A)会消除 CRISPR 干扰活性。CasDinG 虽缺乏协调铁硫簇的保守 C 残基,但保留了与 DinG 中 FeS 结构域长度相当的 pFeS 结构域,该结构域起结构作用并有助于 DNA 结合。Arch 结构域与 DinG 和 YoaA 的相似但更紧凑,NTD 经 AlphaFold3 预测由四个 α 螺旋组成,其缺失会损害 IV - A 型免疫,但不影响 ATP 酶、ssDNA 结合或解旋酶活性。
3.4. CasDinG - HNH
Altae - Tran 等人在Sulfitobacter sp. JL08 中发现一种独特的 CasDinG 变体,该变体与一种变异的 IV 型 CRISPR - Cas 系统相关,因其 C 末端有 HNH 核酸酶结构域,故被命名为 CasDinG - HNH。在Nordella sp. HKS 07 中也鉴定出了其同源物。
CasDinG - HNH 基因通常位于cas5、cas8、cas6、cas7和 CRISPR 阵列下游,该系统通过 RNA 引导的原间隔相邻基序(PAM)依赖的定向 dsDNA 降解发挥干扰活性。Sulfitobacter sp. JL08 的 CasDinG - HNH(SuCasDinG - HNH)中,ATP 酶位点和核酸酶位点的保守残基突变会消除干扰活性。推测 CasDinG - HNH 结合 R 环内的 NTS,沿 NTS 5′–3′方向易位并切割靶标链和非靶标链。
目前尚无 CasDinG - HNH 的实验结构信息,AlphaFold3 对SuCasDinG - HNH - ssDNA - ATP 复合物的预测显示,其结构与EcDinG 和PaCasDinG 有显著差异。SuCasDinG - HNH 的 Arch 结构域更紧凑,pFeS 结构域高度浓缩,且缺乏 α5a 螺旋,取而代之的是 β - 发夹结构。
HNH 核酸酶通常以单体或同源二聚体形式发挥作用,切割核酸。SuCasDinG - HNH 的 HNH 结构域与 IscB、E. coli McrA 和 Cas5e 等蛋白的 HNH 结构域结构相似,这些蛋白参与宿主防御机制,提示SuCasDinG - HNH 可能有类似功能。SuCasDinG - HNH 的 HNH 结构域与 IscB 的 HNH 结构域在金属离子配位和底物结合模式上有相似之处,且都含有 Zn 指基序。而Nordella sp. HKS 07 的 CasDinG - HNH(NoCasDinG - HNH)的 HNH 结构域与SuCasDinG - HNH 有明显差异,其基因上下游的基因组成也不同,这引发了对其功能和作用机制的疑问。
3.5. ExoDinG
一些细菌目的 DinG 样蛋白在 N 端进化出融合的推定 3′–5′核酸外切酶结构域,被称为 ExoDinG。其生物学作用尚未完全阐明,在金黄色葡萄球菌(Staphylococcus aureus)和枯草芽孢杆菌(Bacillus subtilis)中,ExoDinG 不受 LexA 调节,不参与 SOS 反应。
已证实S. aureus的 ExoDinG(SaExoDinG)对 ssDNA 和 ssRNA 底物具有活性 3′–5′核酸外切酶活性,但缺乏解旋酶活性。部分 ExoDinG 蛋白含有 pFeS 结构域,其与SaExoDinG 缺乏解旋酶活性的关系尚不清楚。
目前无 ExoDinG 的结构信息,通过 AlphaFold3 对B. subtilis的 ExoDinG(BsExoDinG)进行结构预测,结果显示其与 ssDNA 和 ATP 结合的复合物有两条 DNA 链。一条链与 MD1 和 MD2 结合,另一条链与 N 端结构域(NTD)结合。NTD 由五个 β 链和多个 α 螺旋组成,含有一个 DEDDh 基序,与其他 3′–5′核酸外切酶相似。DALI 分析表明,BsExoDinG 的 NTD 与多种核酸外切酶拓扑相似,提示 ExoDinG 可能参与核酸加工、DNA 修复、RNA 成熟及维持基因组稳定性等过程,其解旋酶凹槽的存在暗示它可能在特定条件下具有核酸解旋功能。
3.6. pExoDinG
特定细菌目的 DinG 样蛋白含有与 ExoDinG 的 N 端核酸酶结构域拓扑相似的 NTD,但该结构域的推定核酸酶中心不完整,仅含两个保守酸性残基,因此被命名为假 ExoDinG(pExoDinG)。
通过 AlphaFold3 对Caulobacter vibrioides的 pExoDinG(CvpExoDinG)进行建模,未发现其有金属配位的活性位点,表明 pExoDinG 可能缺乏核酸酶活性。其 NTD 与 ExoDinG 相比有明显特征,如 α 螺旋数量不同,且缺少连接 NTD 和 MD1 的 β - 发夹结构。但 pExoDinG 的 ATP 酶位点和螺旋酶通道中的 DNA 结合模式与EcDinG 和PaCasDinG 相似,FeS 结构域的四个 C 残基保守,可能参与 [4Fe - 4S] 簇的配位,暗示 pExoDinG 可能仍保留解旋酶活性。
目前尚无 pExoDinG 生化活性和生物学功能的报道,DALI 分析显示其 NTD 与 DEDDy 型核酸外切酶结构相似,但由于关键残基缺失,其核酸酶核心可能无活性。不过,NTD 可能通过结合单链核酸发挥调节或结构作用,影响解旋酶结构域的功能,pExoDinG 可能参与 DNA 修复、RNA 成熟或基因组稳定性相关途径,需进一步实验研究。
3.7. EndoDinG
一些 DinG 样蛋白含有额外的 N 端 5′ - 3′核酸外切酶 / 核酸内切酶结构域,研究发现Bdellovibrio bacteriovorus HD100 的 DinG(该亚组的代表成员)具有核酸内切酶活性,因此这类蛋白被命名为 EndoDinG。
目前无 EndoDinG 的结构信息,通过 AlphaFold3 对B. bacteriovorus的 EndoDinG(BbEndoDinG)进行结构预测,结果显示其与 ssDNA 和 ATP 结合的复合物有两条 DNA 链。一条链与 MD1 和 MD2 结合,另一条链与 NTD 结合。与 DinG 相比,EndoDinG 缺少 MD2 中的 β7 链,Arch 结构域更短。NTD 由六个 β 链和五个 α 螺旋组成,形成 PD - (D/E) XK 基序,含有四个保守氨基酸,可能形成催化中心,与其他 PD - (D/E) XK 型 5′–3′核酸外切酶类似。
DALI 分析表明,BbEndoDinG 的 NTD 与多种 5′–3′核酸外切酶 / 核酸内切酶结构相似,这些酶参与 DNA 修复和复制过程,提示 EndoDinG 可能也有类似功能。EndoDinG 含有保守的 FeS 结构域,许多 PD - (D/E) XK 型 5′–3′核酸外切酶也含有 FeS 簇,FeS 簇在这些酶中对稳定结构、促进 DNA 结合和调节核酸酶活性起关键作用,因此推测 EndoDinG 中的 FeS 簇也有类似功能。
3.8. RadC 样 DinG
某些 DinG 样蛋白含有额外的 N 端 RadC 样结构域,被称为 RadC 样 DinG。目前尚无对 RadC 样 DinG 的研究,E. coli radC突变体对 DNA 损伤剂的敏感性正常,表明 RadC 的功能可能与 DNA 修复无关。
对Desulfuromonas soudanensis的 RadC 样 DinG(DsRadC 样 DinG)进行序列分析和结构建模,发现其除含有 RadC 样结构域外,整体结构与 YoaA 有很大相似性,但 MD2 结构域中的 α7 螺旋功能可能与 YoaA 不同,因为编码 RadC 样 DinG 的生物体中不存在 HolC 同源物。
RadC 样结构域由五个 β 链和 α 螺旋结构元件组成,中心区域有四个保守氨基酸,可能形成催化中心。DALI 分析显示,该结构域与金属蛋白酶拓扑相关,如Pyrococcus furiosus的 JAMM/MPN?金属蛋白酶(PfJAMM1)和Caldiarchaeum subterraneum的 Rpn11(CsRpn11),基于这些蛋白对 Zn2?离子的偏好,在 RadC 样结构域的推定催化中心模拟了一个 Zn2?离子,其功能和催化活性有待进一步研究。
3.9. sDinG(短型 DinG)
鉴定出一类独特的短型 DinG(sDinG)同源物,其仅含有 MD1、MD2 和 Arch 三个结构域,存在于念珠藻目(Nostocales