编辑推荐:
为解决菜豆基因组学知识匮乏、难以助力育种的问题,相关研究人员开展了识别菜豆保守 TFBS 及研究基因调控网络的研究。结果发现关键 TFBS 及遗传变异。这为菜豆遗传改良提供依据,推荐科研读者阅读。
探秘菜豆基因调控密码:比较基因组学带来的新突破
在全球人口不断增长和气候变化的双重压力下,粮食安全面临着严峻挑战。要想培育出产量更高、抗病虫害能力更强、适应气候变化的作物,遗传改良成为了关键策略。菜豆(Phaseolus vulgaris)作为拉丁美洲和非洲数百万人的主食,富含能量(淀粉)、蛋白质、纤维和重要矿物质,是解决粮食危机的潜力选手。然而,菜豆的基因组学研究却相对滞后,育种家们可利用的基因组知识少之又少,尤其是转录因子结合位点(TFBS,transcription factor binding site)的注释以及基因调控网络的相关信息严重缺乏,这就像给育种家们在培育优良菜豆品种的道路上设置了重重障碍。
为了突破这些障碍,来自相关研究机构的科研人员潜心研究,并在《BMC Genomics》期刊上发表了题为 “Comparative genomics approach to identify conserved transcription factor binding sites in common bean (Phaseolus vulgaris) and study gene regulatory networks” 的论文。他们通过一系列研究,发现高度保守的基因往往具有保守的启动子区域,还识别出了许多与关键转录因子家族相关的保守 TFBS,这对于调控菜豆的重要生物学过程意义重大。此外,他们还揭示了不同菜豆品种在保守 TFBS 上的遗传变异,为后续的育种工作提供了关键线索。这项研究为菜豆的基因调控研究打开了新的大门,也为其他面临类似基因组注释难题的作物研究提供了借鉴。
科研人员在研究过程中,运用了多种关键技术方法。他们先从 Ensembl Plants 数据库获取了菜豆(P. vulgaris)、赤小豆(Vigna angularis)、绿豆(V. radiata)和大豆(Glycine max)的基因数据。在提取菜豆启动子区域时,针对当时 Ensembl Plants 使用的菜豆参考基因组版本(v1.0)与最新版本(v2.1)的差异,选取了两个版本中相似性高的启动子区域(-2000 到 +200 相对于转录起始位点 TSS)进行分析。利用 Minimap2 软件对这些区域进行序列比对,筛选出相似度 90% 以上的启动子用于后续研究。在功能注释方面,借助 Blast2GO 软件对菜豆基因进行功能注释。同时,通过 Ensembl Plants 数据库的资源获取了其他三种豆类的直系同源基因,并利用 Minimap2 软件对这些同源基因的启动子进行比对分析。此外,还运用了 FIMO、GOATOOLS 等工具进行基序富集分析、功能富集分析等,从多方面对菜豆基因进行深入研究。
启动子区域的序列相似性研究
科研人员将菜豆基因的启动子区域与赤小豆、绿豆、大豆的直系同源基因启动子区域进行比对。为了确保结果的准确性,他们还进行了 “假同源基因” 的比对实验,即打乱菜豆与其他三种豆类的同源关系后重新比对,结果发现很少出现假阳性的相似启动子。在参与分析的 23,811 个基因中,有 12,754 个基因的启动子区域与赤小豆同源基因相似,10,202 个与绿豆同源基因相似,8,928 个与大豆同源基因相似,且平均百分比同一性分别为 0.22、0.22 和 0.18 。进一步研究发现,启动子区域的相似性在转录起始位点(TSS)附近最高,随着与 TSS 距离的增加,相似性逐渐降低。而且,物种间的进化距离越远,TSS 周围相似核苷酸的启动子区域数量就越少。通过线性回归分析还发现,同源基因之间的相似百分比可以在一定程度上预测相似启动子的存在,同时,高相似性的同源基因更有可能拥有相似的启动子。这一系列结果表明,高度保守基因的启动子区域在 TSS 附近往往具有高度相似的序列,这一发现为后续研究保守调控信号提供了重要依据。
保守 TFBS 的特征研究
科研人员使用 FIMO 工具在菜豆基因的启动子区域预测出大量的潜在 TFBS,多达 6,222,675 个。经过保守性测试后,发现其中 219,742 个是保守的,这些保守位点存在于菜豆与至少一种研究物种之间。从保守位点的分布来看,大约 3.8% 的保守基序存在于所有四个物种的启动子上,29% 在菜豆和另外两个物种之间保守,67% 仅在菜豆和一个研究物种之间保守 。超过 90% 具有相似启动子的基因至少有一个保守基序,并且 16% 的保守 TFBS 位于注释的上游基因内。在众多转录因子家族中,ERF 家族的保守位点最为常见,这与菜豆基因组中 ERF 基因数量较多有关。其他常见的转录因子家族如 MYB、bHLH 和 C2H2 也有较多的保守位点。通过对保守 TFBS 在启动子上的分布进行研究发现,其分布与启动子之间的相似性水平密切相关,在 TSS 附近数量最多,随着上游位置的增加而迅速减少。
保守 TFBS 与可及染色质区域的关联研究
调控元件通常位于活跃的可及染色质区域(ACRs,Accessible Chromatin Regions),以便转录因子能够结合。科研人员利用公开的菜豆叶片 ATAC-seq 数据,对 ACRs 和保守 TFBS 之间的关系进行了研究。在 19,089 个报告的 ACRs 中,有 6,721 个位于含有保守基序的 5,331 个基因的启动子内。这些基因高度富集在光合作用和代谢相关过程中,这与叶片的功能相契合。进一步研究发现,这些基因中 51.8% 的独特保守基序位于 ACRs 内,而 ACRs 仅占研究启动子长度的 19%。通过 χ2 检验发现,ACRs 与其中保守核苷酸的数量之间存在显著关系,这表明研究人员对 TFBS 的保守性分析与染色质可及性的特征相符,进一步验证了研究方法的有效性。
基于保守基序的 TF 家族生物学功能研究
科研人员通过对含有保守 TFBS 的靶基因进行 GO 富集分析,来探究 TF 家族是否参与特定细胞功能的调控。他们总共发现了 198 个与 38 个 TF 家族相关的富集 GO 术语。像 ERF、MYB 和 C2H2 等大型 TF 家族,与众多 GO 术语显著相关,不过,显著相关的 GO 术语数量与特定 TF 家族的保守位点数量并没有直接的关联。以 AP2 家族为例,这个家族在植物生长发育、应对环境胁迫等过程中发挥着关键作用。研究人员发现 AP2 家族与 18 个 GO 术语显著相关,其中多个功能在其他植物物种中已得到验证。比如,AP2 转录因子 WRINKLED1 在拟南芥中调节丙酮酸激酶,在菜豆的研究中也发现 AP2 家族与 “丙酮酸激酶活性” 相关,并且在具有该生物学功能的基因启动子上有保守结合基序。此外,AP2 转录因子还与细胞周期蛋白依赖性蛋白激酶(CDK)相关的术语有关,这与之前报道的该 TF 家族和 CDK 参与植物防御反应机制的结论一致。不过,研究中也发现一些与 AP2 家族相关的 GO 术语缺乏文献支持,这些可能是新的潜在功能,也可能是假阳性结果,有待进一步研究验证。
淀粉生物合成调控研究
由于菜豆作为主食的重要地位,科研人员对其淀粉生物合成的 TF 调控景观进行了研究。在参与淀粉生物合成的六个基因组中,根据植物代谢网络,有 29 个基因,其中 18 个基因的启动子区域含有保守 TFBS 。平均每个淀粉生物合成基因的启动子区域包含 16 个保守基序,淀粉合酶 III(SSIII)的保守基序最多,高达 101 个。这一现象符合核心基因具有更保守调控组成的理论。在 SSIII 启动子区域,主要的保守基序对应 ERF、MIKC MADS 和 C2H2 TF 家族,这些家族在其他植物物种的淀粉生物合成中也有重要作用,其中 ERF TFs 已被证明可直接结合 SSIII 启动子。科研人员还将 SWEET 转运蛋白旁系同源组纳入研究,构建了共现家族网络,发现 C2H2、MYB 等 TF 家族倾向于在 SWEET 基因的启动子上多次共现。通过对文献的系统检索发现,具有既定调控作用的 TF 家族在其潜在基因的启动子上往往有大量 TFBS,这进一步验证了功能 TF 预测的准确性。此外,研究还发现了一些在淀粉生物合成基因启动子上有大量保守基序但缺乏文献支持的 TF 家族,这些家族是未来实验研究的重点对象。
不同菜豆品种保守 TFBS 的遗传变异研究
菜豆存在两个独立进化的基因库 —— 安第斯基因库和中美洲基因库,它们的种子淀粉含量存在差异。科研人员分析了这两个基因库以及驯化过程中 TFBS 的多态性,对 125 个不同基因型的菜豆品种进行了研究。在 20 个测试的淀粉基因中,8 个基因的启动子在预测的保守 TFBS 内存在多态性,共鉴定出 16 个多态性,影响了 20 个保守 TFBS,涉及 RAV、ARF、C2H2 等多个 TF 家族。例如,在葡萄糖 - 1 - 磷酸腺苷酰转移酶(AGPase)基因启动子上的一个 SNP(Pvulgaris_442_v2.1:11.3960161 A>T),位于 RAV 转录因子家族的 TFBS 内,在中美洲基因库中普遍存在,而在安第斯基因库中很少见,这可能与两个基因库淀粉生物合成的差异有关。虽然目前还没有发现 ARF、C2H2、YABBY 转录因子调节淀粉合酶基因表达的证据,但这些遗传变异为研究淀粉代谢的调控差异提供了重要线索。而且,研究发现野生和驯化品种之间在保守 TFBS 上没有显著的遗传变异,这表明这些调控变化与安第斯和中美洲基因库的分化关系更密切。
这项研究通过比较基因组学的方法,对菜豆基因启动子区域的 TFBS 进行了全面分析。研究结果不仅揭示了菜豆基因调控网络的重要特征,还为菜豆的遗传改良提供了有价值的信息。虽然研究存在一定的局限性,如可能出现假阳性和假阴性结果,无法检测物种特异性的 TFBS 等,但通过文献验证和对淀粉生物合成途径的研究,证明了研究方法的可靠性和研究结果的潜在价值。该研究为进一步探索菜豆重要农艺性状的调控机制奠定了基础,未来可以基于这些发现开展更深入的功能研究,通过靶向育种来改善菜豆的性状,提高其产量和品质,以应对粮食安全挑战。同时,这种比较基因组学的研究方法也为其他作物的基因调控研究提供了有益的参考,有望推动整个作物遗传学领域的发展。
娑撳娴囩€瑰宓庢导锔炬暩鐎涙劒鍔熼妴濠団偓姘崇箖缂佸棜鍎禒锝堥樋閹活厾銇氶弬鎵畱閼筋垳澧块棃鍓佸仯閵嗗甯扮槐銏狀洤娴f洟鈧俺绻冩禒锝堥樋閸掑棙鐎芥穱鍐箻閹劎娈戦懡顖滃⒖閸欐垹骞囬惍鏃傗敀
10x Genomics閺傛澘鎼isium HD 瀵偓閸氼垰宕熺紒鍡氬劒閸掑棜椴搁悳鍥╂畱閸忋劏娴嗚ぐ鏇犵矋缁屾椽妫块崚鍡樼€介敍锟�
濞嗐垼绻嬫稉瀣祰Twist閵嗗﹣绗夐弬顓炲綁閸栨牜娈慍RISPR缁涙盯鈧鐗哥仦鈧妴瀣暩鐎涙劒鍔�
閸楁洜绮忛懗鐐寸ゴ鎼村繐鍙嗛梻銊ャ亣鐠佹彃鐖� - 濞e崬鍙嗘禍鍡毿掓禒搴n儑娑撯偓娑擃亜宕熺紒鍡氬劒鐎圭偤鐛欑拋鎹愵吀閸掔増鏆熼幑顔垮窛閹貉傜瑢閸欘垵顫嬮崠鏍掗弸锟�
娑撳娴囬妴濠勭矎閼崇偛鍞撮摂瀣鐠愩劋绨版担婊冨瀻閺嬫劖鏌熷▔鏇犳暩鐎涙劒鍔熼妴锟�