编辑推荐:
为探究基因调控网络对表型变异的影响,研究人员分析大肠杆菌转录变异,发现关键调控因子,意义重大。
# 探秘大肠杆菌转录变异:解锁基因调控网络的神秘力量
在生命的进化长河中,生物的表型变异宛如一座神秘的宝藏,吸引着无数科学家探索其背后的奥秘。生物的表型变异不仅关乎个体的生存与繁衍,更是推动物种进化的关键力量。然而,这座宝藏却隐藏着诸多谜团。我们知道,生物的表型变异可由遗传或环境因素引发,且不同的变异在生物应对扰动时出现的频率并不相同。但究竟是什么在背后操纵着这一切?基因调控网络在其中又扮演着怎样的角色?这些问题就像一团团迷雾,笼罩着生物学研究的领域,亟待科学家们去驱散。
为了揭开这些谜团,来自东京大学研究生院理学系综合生物学研究所等机构的 Saburo Tsuru 和 Chikara Furusawa 等研究人员踏上了探索之旅。他们以大肠杆菌(Escherichia coli)为研究对象,深入剖析其在不同扰动下的转录变异性,相关研究成果发表在《Nature Communications》上。
研究人员开展这项研究时运用了多种关键技术方法。在实验菌株构建方面,构建了缺失 dnaQ 基因的大肠杆菌 MG1655 突变株用于突变积累(MA)实验。实验过程中,通过 MA 实验模拟自然进化中的遗传扰动,获取不同突变谱系的转录组数据。同时,收集公共数据库中的转录组数据,包括不同环境条件下的 Env 数据集以及自然菌株的 Evo 数据集。对于转录组分析,运用 DNA 微阵列技术和 RNA 测序技术获取转录组数据,并进行一系列的数据处理与分析,如量化标准化、log2转换,计算基因表达水平的均值和标准差等,还利用主成分分析(PCA)、基因集富集分析(GSEA)等方法挖掘数据背后的生物学意义。
环境与遗传扰动下转录变异的相似性
研究人员首先对两个公共转录组数据集进行分析。Env 数据集包含大肠杆菌 K12 MG1655 在 76 种独特环境条件下的 160 个转录组图谱;Evo 数据集则是 16 种自然菌株在相同环境下的转录组图谱。此外,通过 MA 实验构建了 Mut 数据集,包含 6 个 MA 谱系的转录组数据。为准确衡量转录变异性,研究人员计算了每个基因表达水平的标准差受均值影响后的垂直偏差(DM)。结果发现,不同数据集的 DM 值之间存在正相关,这表明对环境扰动敏感的基因,在表达水平上往往对遗传扰动也更敏感。从功能类别来看,在基因本体(GO)和京都基因与基因组百科全书(KEGG)通路层面,不同数据集的 DM 值同样呈现正相关。例如,与鞭毛依赖性细胞运动和氨基酸分解代谢过程相关的基因,在各数据集中 DM 值较高;而与细胞壁构建和维持相关的基因,DM 值较低。这说明基因转录水平的变异与其功能存在密切联系。
影响转录变异性的转录调控因子
为探究转录变异性的内在机制,研究人员利用 GSEA 分析转录调控因子对转录变异性的影响。他们从 RegulonDB 和 EcoCyc 数据库收集已知的调控相互作用信息,分析发现影响高 DM 值和低 DM 值靶基因的转录调控因子。结果显示,在 Env 数据集中,有 30 个转录调控因子在高 DMenv值基因中富集,如 FlhDC 和 Fur;而低 DMenv值基因中仅有 4 个转录调控因子富集。进一步分析发现,有 13 个转录调控因子(TRcom)在三个数据集(Env、Evo、Mut)中都存在,且其数量显著高于随机预期。这表明 TRcom调控的靶基因在面对环境和遗传扰动时,转录变异性更高,是影响转录变异性的关键因素。
转录调控因子影响转录变异性的网络特征
TRcom是如何增强靶基因转录变异性的呢?研究发现,TRcom是全局调控因子,拥有大量靶基因,且它们之间相互调控频繁,形成了一个连接紧密的网络。这个网络的边缘密度显著高于随机预期,有利于扰动信号在其中传播。与未受 TRcom调控的基因相比,受 TRcom调控的靶基因 DM 值更高,且 DM 值与 TRcom调控数量呈正相关。此外,通过对基因调控网络进行蝴蝶结分解,发现 TRcom大多属于强连通分量(SCC),能接收来自细胞内外部的多种扰动信号。而且,超过一半的 TRcom是感官调控因子(SR),这使得它们既能处理信息,又能感知刺激,从而更有效地增强转录变异性。
环境与遗传扰动下转录变异方向的相似性
理论上,遗传和环境引起的表型变异在主要轴向上应具有相似性。为验证这一理论,研究人员对每个数据集进行 PCA 分析。结果显示,前三个主成分(PC1 - 3)分别解释了 Env、Evo 和 Mut 数据集中 46%、53% 和 57% 的总变异,是转录变异的主要轴。通过相关性分析发现,不同数据集主成分的方向相似,Env 数据集中的 PC1 与 Evo 和 Mut 数据集中的 PC1、PC2 有较强相关性。此外,Env 数据集的主成分能解释 Evo 和 Mut 数据集较高比例的变异,远超随机预期。进一步分析发现,转录调控因子在主成分的正负方向上均有富集,且有 31 个调控作用在三个数据集中都存在,其中 11 个由 TRcom调控。这表明转录变化方向的相似性源于共享的转录调控。对具有重连转录调控的大肠杆菌突变体转录组分析也证实,打乱调控网络会改变转录变异的方向性,凸显了全局调控因子间调控网络的重要性。同时,在功能富集分析中发现,不同数据集中主成分的功能类别存在相似的方向性,如 Env 数据集中 PC1 在正向富集翻译等与生长相关的过程,负向富集应对饥饿等过程,且这种相反的功能方向在不同扰动下保持一致。
不同扰动下表型变异性的相似性
为探究研究结果在更广泛扰动下的适用性,研究人员分析了五个额外的数据集,包括不同环境或遗传扰动下的转录组或蛋白质组数据。结果发现,这些数据集的 DM 值与三个主要数据集(Env、Evo、Mut)呈正相关,尤其是与 DMenv的相关性较强。通过 PCA 分析发现,额外数据集的 PC1 与三个主要数据集的 PC1 或 PC2 相关,表明转录变异性在蛋白质水平也能保留,且在不同环境和遗传扰动下具有相似性。这意味着在不同扰动下,基因表达变异的幅度和主要方向存在相似趋势,体现了全局的 canalization/decanalization 现象。
在这项研究中,研究人员通过对大肠杆菌的深入研究,揭示了不同扰动下转录变异性的遗传特性。他们发现了关键的全局转录调控因子,这些因子相互作用形成有利于信号传播的网络结构,对基因组表达水平的变化方向产生重要影响。该研究为理解非均匀表型变异的分子机制提供了新视角,表明转录偏差在多种条件下都存在,且与应对环境波动的关键功能密切相关,对生物在遗传和非遗传层面适应环境具有重要意义。不过,这项研究仅聚焦于大肠杆菌 MG1655 及其相关菌株的转录组调控网络。未来,若能对不同大肠杆菌菌株或其他细菌物种的转录调控网络进行研究,将更全面地揭示转录变异性与调控网络之间的关系,进一步推动生物学领域对生物进化和环境适应机制的理解。