全基因组鉴定长链非编码 RNA:揭示其与致病疫霉无性和有性发育的潜在关联,为农业病害防控提供新靶点

【字体: 时间:2025年03月27日 来源:Microbiology Spectrum 3.7

编辑推荐:

  这篇研究通过重新分析致病疫霉(Phytophthora infestans)的链特异性 RNA 测序数据,系统鉴定出 4,399 个长链非编码 RNA(lncRNAs)。研究发现 lncRNAs 在无性和有性发育阶段均有潜在调控作用,为深入理解卵菌生殖调控网络提供新视角。

  ### 引言
卵菌是一类与藻类在进化上相关的真菌样微生物,属于茸鞭生物界的真核生物,也是多细胞原生生物。其中,疫霉属、腐霉属和霜霉病原体等多个卵菌种,能致使数百种植物宿主患病,给农业带来严重破坏,造成巨大经济损失。疫霉的无性发育在其侵染植物过程中至关重要,而有性阶段则通过产生新的侵袭性基因型来维持其生存。卵孢子由同宗配合(自育)物种和异宗配合(在疫霉中称为 A1 和 A2 两种交配型)的配对产生,且能在土壤中存活并保持感染力超 36 个月。不过,目前关于卵菌交配生物学的信息较为有限,在疫霉中,已鉴定出的交配激素对功能基因的调控也鲜有报道。
非编码 RNA(ncRNAs)可参与对抗病毒、细菌和真菌攻击的防御反应,它基于序列大小分为小非编码 RNA(smRNAs)和长链非编码 RNA(lncRNAs)。smRNAs 的功能已被深入研究,但 lncRNAs 的相关信息仍有限。lncRNAs 由 RNA 聚合酶 II 转录,长度超过 200 个核苷酸,根据基因组位置和转录方向可进一步分为基因间 lncRNAs、内含子 lncRNAs、反义 lncRNAs 和正义 lncRNAs 四类,它在多种生物学过程中发挥关键作用,可通过顺式(cis)和反式(trans)作用调控机制靶向蛋白质编码基因。此前虽已描述过致病疫霉中的一个 lncRNA 样家族,但对该卵菌物种的 lncRNAs 缺乏全基因组鉴定和功能研究。

本研究获取并重新分析了致病疫霉不同无性发育阶段和有性生殖的链特异性 RNA 测序数据,数据集包含两个菌株(1306 和 88089)的无性发育阶段(菌丝体(MY)、孢子囊(SP)、裂解孢子囊(CS)、游动孢子(ZO)和萌发孢子囊(GCs))以及三个不同杂交组合的有性生殖阶段数据。研究旨在全面分析卵菌中的 lncRNAs,探究其与功能基因的潜在关联。

材料和方法


研究从美国国立生物技术信息中心(NCBI)获取致病疫霉的链特异性 RNA 测序数据(生物项目登录号 PRJNA361417 和 PRJNA445478)用于鉴定 lncRNAs,同时获取了与交配(PRJNA369047)和不同生长时间(PRJNA413149)相关的 RNA 测序数据用于验证结果。

在鉴定、注释和定量 lncRNAs 的生物信息学流程中,首先用 Trimmomatic 软件过滤去除原始 RNA 测序读段中的接头和低质量碱基,剩余高质量读段通过 HISAT(v.2.1.0)比对到致病疫霉参考基因组。接着用 StringTie 软件(v.2.1.3)组装每个样本的转录本,再使用 Gffcompare(v.0.11.2)将组装的转录本与致病疫霉基因组注释进行比较。之后用 Salmon(v.0.14.1)对组装的转录本进行定量,转录本丰度以每百万转录本(TPM)的平均值衡量。通过设计的计算流程鉴定 lncRNAs,先排除预测开放阅读框超过 100 个氨基酸且长度小于 200bp 的转录本,再用 CNCI、FLEK 和 CPC2 计算编码潜力,去除被至少一种软件标记为编码的转录本,最后将剩余转录本与 UniProt 和 Pfam 蛋白质数据库进行 BLASTP 比对(E 值 < 0.001),过滤潜在的蛋白质编码基因。

在靶点预测方面,将位于 lncRNA 同一支架 5′上游或 3′下游 10kb 内的蛋白质编码基因定义为潜在的cis靶点。通过计算蛋白质编码基因与 lncRNA 的表达水平的皮尔逊相关性,将相关性高(|r|>0.8 且P≤0.05)的蛋白质编码基因视为相应 lncRNA 的潜在trans靶点。

为分析 lncRNAs 和 mRNAs 的差异丰度,使用 R 包 DESeq2(v.1.38.3)基于读数计数数据进行差异表达分析,将 log2(倍数变化)≥1 且P值≤0.05 的转录本视为显著差异表达。利用 TBtools 绘制 lncRNAs 和 mRNAs 在所有致病疫霉支架上的分布图,用 R 包 ggplot 绘制气泡图、表达模式图和热图,用 R 包 TCseq2 分析 lncRNA 和 mRNA 的表达趋势,用 TBtools 软件绘制维恩图,用 Cytoscape 软件(v.3.10.0)构建 lncRNAs 与靶点之间的相互作用网络,用 KOBAS 进行京都基因与基因组百科全书(KEGG)富集分析,研究靶点基因的生物学过程。

加权基因共表达网络分析则是利用 lncRNA 和 mRNA 的 TPM 值,通过 R 包加权基因共表达网络分析(WGCNA)构建共表达网络。计算 lncRNA 或 mRNA 模块的特征值与发育阶段之间的相关性,评估模块与性状的关联。确定满意的软阈值为 19,用邻接函数根据软阈值构建邻接矩阵,基于邻接矩阵使用拓扑重叠(TO)矩阵相似性算法生成 TOM,用于 lncRNAs 或 mRNAs 的层次聚类,采用动态树切割算法得到层次聚类树状图,排除平均 TO 值较低的模块,将相关系数r>0.7 的模块视为高度相关,正相关表示 lncRNAs 和 mRNAs 在特定阶段比其他阶段表达更高或更优先表达。

结果


研究对 61 个致病疫霉样本(包括 44 个无性发育和 17 个有性生殖数据集)的高通量链特异性 RNA-seq 数据重新分析,共生成 30.2 亿条读数,约 45.69% 映射到致病疫霉基因组。从 80,265 个组装转录本中,经计算流程系统鉴定出 4,399 个推定的 lncRNAs。根据 lncRNA 与同一支架上最接近的蛋白质编码基因的转录方向,分为正义 lncRNA(1,809 个)、反义 lncRNA(2,586 个)和链未知 lncRNA(4 个),每种类型又进一步分为内含子、外显子、上游和下游 lncRNAs 四个亚型。

对鉴定出的 lncRNAs 特征分析发现,其表达水平显著低于 mRNAs(P值 < 0.001),具有多个外显子的 lncRNAs 比例(63.76%)高于 mRNAs(60.78%),长度显著短于 mRNAs(中位数长度:358bp 对 1,227bp)。在致病疫霉的 4,921 个支架中,505 个产生 mRNAs,366 个产生 lncRNAs,280 个同时产生两种转录本,且在同时产生两种转录本的 10 个支架上,mRNAs 和 lncRNAs 分布均匀。通过 BLASTN 搜索分析致病疫霉和大豆疫霉 lncRNA 序列的保守性,结果显示只有 31 个致病疫霉 lncRNAs 在大豆疫霉 lncRNAs 中有匹配,表明致病疫霉 lncRNAs 的保守性较低。

预测 lncRNAs 靶点时,基于位置(cis,≤10kb)和表达模式(trans,| 相关性 |≥0.8,P值 < 0.05)分别预测,共鉴定出 9,725 个cis(5,818 个 mRNAs)和 88,308 个trans(3,686 个 mRNAs)相互作用对,仅有 280 个共享对(266 个 mRNAs)。共享对中多个 mRNA 编码侵袭和交配相关蛋白,如分泌型 RxLR 效应肽蛋白和 M96 交配特异性蛋白。对cistrans对的 mRNAs 进行 KEGG 富集分析,前 20 条通路中有 17 条共享,包括碳代谢、内吞作用和泛素介导的蛋白水解等,说明尽管共享对数量较少,但 lncRNAs 通过cistrans作用调控模式调节的生物学过程相似。

在无性发育阶段相关 lncRNAs 的功能分析中,鉴定出不同发育阶段(SP、CS、ZO、GCs 与 MY 相比)的差异表达 lncRNA(DElncR)和差异表达 mRNA(DEmR),通过 WGCNA 构建共表达模块,得到 20 个模块,其中 8 个与不同阶段显著相关。如 antiquewhite2 模块与菌丝体相关性强(r = 0.94),coral2 模块与孢子囊相关性高(r = 0.93)等。这些高度相关模块包含 1,449 个 lncRNAs,对其特征分析发现 51.03% 含两个外显子,仅 5.34% 长度超过 1,000bp。对高度相关模块中 DElncR 靶向的 DEmRs 进行 KEGG 通路富集分析,发现多个通路参与一个或多个发育阶段,表明 lncRNAs 通过调节与多个生物学通路相关的 mRNA,在不同发育阶段发挥调控作用。

为探究阶段转变过程中的关键因素,鉴定各阶段与其前一阶段之间的 DElncRs 和 DEmRs。在不同菌株间比较,发现多个共享的 DEmRs,KEGG 富集分析显示代谢途径、次生代谢产物的生物合成、内吞作用和氨基酸的生物合成在所有阶段均显著富集。同时鉴定出各生长阶段转变过程中的共享 DElncR - DEmR 对,表明这些对可能在致病疫霉生长阶段转变中起重要作用。

构建致病疫霉无性发育过程中的 lncRNA - mRNA 网络时,分析所有发育阶段 DElncRs 和 DEmRs 的表达趋势,将其聚类为 6 种类型。其中 DElncR_cluster 2 和 DEmR_cluster 3 中 426 个 DElncRs 和 2,451 个 DEmRs 的表达水平在发育过程中持续升高,对这些 DEmRs 进行 KEGG 富集分析,发现多个与发育和侵袭途径相关的 DEmRs 受 DElncRs 调控,如抗生素生物合成、碳代谢和肌醇磷酸代谢等,且部分 DEmRs 编码的发育和侵袭相关蛋白受 DElncRs 正调控,通过分析部分 lncRNAs 的表达模式验证了结果的可靠性。

在鉴定和功能分析交配诱导的 lncRNAs 时,重新分析非交配、交配和自育菌株的 RNA - seq 数据,鉴定出交配菌株与非交配和自育菌株相比的 DElncRs 和 DEmRs。对 DEmRs 进行 KEGG 通路富集分析,发现多个与有性生殖相关的通路富集。通过 WGCNA 构建共表达模块,得到 19 个模块,其中 2 个与交配高度相关。高度相关模块中的 DElncR - DEmR 对涉及多个与有性生殖相关的调控网络,如 lncRNAs 靶向编码 M96 交配特异性蛋白和 Crinkler(CRN)家族蛋白的基因,表明致病疫霉 lncRNAs 通过调节与交配相关的靶点参与有性生殖,通过分析其他菌株交配过程中部分 lncRNAs 的表达模式验证了结果。

讨论


此前研究表明 lncRNAs 在调节植物或动物无性发育和有性生殖相关基因表达中起重要作用,但致病疫霉 lncRNA 对无性发育和有性生殖调控的数据有限。本研究鉴定出 4,399 个致病疫霉 lncRNA 候选物,其转录长度和转录水平低于 mRNAs,且cistrans靶点预测表明二者涉及的生物学过程相似,为进一步研究卵菌中 lncRNAs 在无性和有性生殖中的功能提供了基础。

在无性发育过程中,不同阶段有多个 DElncR - DEmR 对高度相关。例如,与菌丝体高度相关的 DEmRs 参与肌醇磷酸代谢和氨基糖和核苷酸糖代谢途径,lncRNAs 可能通过靶向这些功能基因调节菌丝体生长;孢子囊阶段,DElncR 靶向的 DEmRs 与谷胱甘肽代谢等途径相关,这些途径可能为细胞质分裂和游动孢子释放储存能量;裂解孢子囊阶段,相关 DEmRs 参与嘌呤代谢等途径,可能促进形态变化;游动孢子阶段,相关 DEmRs 编码药物 / 代谢物转运蛋白,lncRNAs 可能提高致病疫霉的感染能力;萌发孢子囊阶段,相关功能基因较少,lncRNAs 在此阶段的作用有待进一步探索。此外,部分 DElncR - DEmR 对在整个发育阶段持续增加表达,可能通过靶向代谢相关 mRNAs 促进致病疫霉无性发育,且在生长阶段转变过程中,部分差异表达的 mRNAs 可能受 lncRNA 调控。

相比无性发育,卵菌有性发育的分子机制研究更为有限。本研究构建的交配过程中 lncRNA - mRNA 调控网络揭示了许多参与交配诱导的基因,如热休克 70kDa 蛋白(HSP70)和 M96 交配特异性蛋白,它们可能参与卵孢子壁的形成或细胞外物质的合成。此外,CRN 和 RxLR 蛋白家族的基因也受 lncRNAs 调控,除免疫相关作用外,它们在交配中可能也有重要作用,还有部分 DElncR - DEmR 对与有性和无性发育均密切相关。

此前对一些卵菌的转录组动力学研究主要集中在基因功能上,忽略了 lncRNAs 的特征。本研究对致病疫霉无性和有性阶段进行全面转录组分析,发现 lncRNAs 通过调节 mRNAs 与交配和无性发育阶段相关,但其调控网络和功能机制仍需进一步研究验证。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号