剪接多样性增强垂体神经内分泌肿瘤的分子分类
论文发表于Nature Communications,DOI: 10.1038/s41467-025-56821-x
第一作者:Yue Huang、Jing Guo、Xueshuai Han(并列)
接收日期:2024 年 5 月 20 日
发表日期:2025 年 2 月 11 日
更新信息请查阅官网
垂体神经内分泌肿瘤(Pituitary neuroendocrine tumors,PitNETs)是最常见的颅内肿瘤之一,临床表现多样。目前的病理分类系统主要依赖于组织学激素染色和转录因子(Transcription factors,TFs)表达。虽然该系统能有效识别三大细胞谱系,但基于激素和转录因子的分子特征分辨率不足,无法充分捕捉肿瘤的复杂异质性。可变剪接(Alternative splicing,AS)产生的转录多样性为解决这一难题提供了新视角。在此项研究中,中国国家生物信息中心、中国科学院北京基因组研究所等单位的研究人员开展了大量样本及全长单细胞 RNA 测序,全面探究了所有 PitNETs 细胞谱系中的可变剪接失调情况。研究揭示了广泛存在的剪接失调现象,这些现象能更好地描述肿瘤的异质性。此外,研究人员在单细胞分辨率下描绘了基本的剪接异质性,证实了大量样本研究结果,并细化了不同肿瘤细胞类型之间的剪接失调差异。值得注意的是,研究人员有效区分了沉默促肾上腺皮质激素细胞亚型,并定义了一种独特的 TPIT 谱系亚型,该亚型与较差的临床预后相关,且其剪接异常增多与 ESRP1 表达改变有关。总之,研究结果描绘了 PitNETs 中特定亚型的可变剪接图谱,加深了人们对 PitNETs 亚型分类的理解。
垂体是人体最重要的内分泌腺,通过分泌激素调节关键生理功能。垂体神经内分泌肿瘤(PitNETs,又称垂体腺瘤)是起源于垂体前叶(Anterior pituitary gland,APG)的常见颅内肿瘤之一。PitNETs 的病理分类纳入了特定激素基因和三种谱系特异性转录因子(TFs)的表达情况,这三种转录因子包括 PIT1(POU1F1)、TPIT(TBX19)和 SF1(NR5A1)。同一谱系内的肿瘤虽具有相同的转录因子表达,但在细胞功能和肿瘤发生过程中却存在差异。PIT1 谱系肿瘤通常表现为激素过度分泌,包括生长激素细胞肿瘤(分泌生长激素,Growth hormone,GH)、催乳素细胞肿瘤(分泌催乳素,Prolactin,PRL)和促甲状腺激素细胞肿瘤(分泌促甲状腺激素,Thyroid-stimulating hormone,TSH)。混合生长激素 - 催乳素细胞肿瘤分泌 GH 和 PRL(PG),而多激素 PIT1 谱系肿瘤则分泌这三种激素(PIT1M)。TPIT 谱系肿瘤仅有一种类型,即促肾上腺皮质激素细胞肿瘤(分泌促肾上腺皮质激素,Adrenocorticotrophic hormone,ACTH),SF1 谱系包含促性腺激素细胞肿瘤(Gonadotroph tumors,GO,分泌促卵泡激素,Follicle-stimulating hormone,FSH 和促黄体生成素,Luteinizing hormone,LH)。无功能细胞肿瘤(Null cell tumors,NULL)不产生激素,也无特定转录因子表达,而多激素肿瘤则表达多种激素,涉及两个或更多谱系。即便同一亚型的肿瘤,临床表现也各不相同。例如,功能性促肾上腺皮质激素细胞肿瘤因 ACTH 分泌过多,会出现典型的库欣综合征症状,而沉默促肾上腺皮质激素细胞肿瘤(表达 ACTH 但无库欣综合征症状)相比其他亚型,临床行为更为侵袭性。这些肿瘤复杂的激素分泌模式和高度可变的临床结局,对更精确的亚型分类提出了需求,也带来了挑战。然而,至今大多数亚型的发病机制仍未完全明确,且缺乏用于特征描述的基因组标记。
以往研究主要聚焦于探索 PitNETs 的遗传特征或整体基因表达,以寻找额外的分子特征,但忽视了共转录调控。可变剪接(AS)是真核生物中一种重要的细胞过程,可产生多种转录本,使最终的蛋白质产物多样化。除 PitNETs 外,AS 在多种人类肿瘤中已有广泛研究,为深入了解肿瘤间的异质性和开发新疗法提供了宝贵资源。但到目前为止,PitNETs 中剪接变化的整体情况尚未得到充分研究。
在本研究中,来自中国国家生物信息中心、北京基因组研究所等单位的研究人员利用转录组测序,对 PitNETs 队列的可变剪接图谱进行了表征,该队列包含肿瘤组织的大量样本(n = 268 例患者)和全长单细胞 RNA 测序(n = 195,720 个细胞)数据集。研究分析涵盖了几乎所有 PitNETs 亚型,使研究人员能够构建特定亚型的剪接模式以及相应的 RNA 结合蛋白(RNA-binding proteins,RBPs)调控网络。与转录因子的表达相比,研究人员的分析更准确地捕捉到了 PitNETs 的转录组多样性,从而更好地展示了肿瘤间的异质性。值得注意的是,在 TPIT 谱系中,研究人员发现了一种与临床密切相关的独特剪接调控模式。这些发现通过一个包含 180 例垂体肿瘤的独立队列得到了有力验证。总体而言,此项研究为 PitNETs 的分类提供了一种更有效的方法。
研究结果
PitNETs 表现出广泛的剪接多样性
为获取 PitNETs 的整体可变剪接图谱,研究人员对 264 例 PitNETs 患者和 4 例正常样本进行了大量 RNA 测序,并对来自 14 例患者和 2 例正常样本的 195,720 个细胞进行了全长单细胞 RNA 测序(图 1a)。此外,研究人员收集了一个来自 180 例 PitNETs 患者的独立大量 RNA 测序数据集作为验证队列。大量样本发现队列中的患者分布涵盖了所有临床病理亚型,包括三种转录因子谱系、混合亚型、无功能细胞亚型和 4 例正常样本。肿瘤样本进一步分为 10 种临床病理亚型,包括 GH(n = 47)、PG(n = 16)、PRL(n = 26)、TSH(n = 6)、PIT1M(n = 8)、ACTH(n = 58)、GO(n = 91)、混合亚型(n = 9)和无功能细胞亚型(n = 3)(补充图 1 和补充数据 1)。PitNETs 的三大细胞谱系可通过谱系特异性转录因子的表达有效分类。基于这些转录因子和相关激素基因的表达,或整体基因表达进行的主成分分析(Principal component analysis,PCA)显示,存在三个不同的组,分别对应三大细胞谱系(补充图 1b、2 和补充数据 2)。然而,在每个谱系内,各个亚型无法清晰区分(图 1b 和补充图 2b)。例如,在 PIT1 谱系中,无论是基于转录因子表达还是整体基因表达进行分类,GH、PRL 和 TSH 亚型的样本都相互混杂,难以区分(图 1b 和补充图 2b)。这表明 PitNETs 广泛的异质性超出了基于表达的标记物准确分类更具体亚型的能力范围。此外,研究人员发现,亚型特异性激素基因在大多数亚型的部分患者中也普遍高表达(补充图 1c、d)。总体而言,基于转录因子以及基于整体基因表达的分类,在 PIT1 谱系(调整兰德指数,Adjusted rand index,ARI = 0.28 和 0.31)和 TPIT 谱系(ARI = 0.35 和 0.36)中,与临床病理分类的一致性均一般(图 1c 和补充图 2c)。而且,与来自癌症基因组图谱(The Cancer Genome Atlas,TCGA)的其他 33 种癌症类型相比,PitNETs 表达的基因数量相对较少(补充图 1e)。这些发现强调了仅依靠基因表达来表征 PitNETs 亚型的局限性。
与整体基因表达相比,剪接异构体不仅数量更多,还包含有价值的转录本结构信息。此外,剪接产生的功能多样性已被证明会影响各种与癌症相关的过程,这表明整合可变剪接信息可能有助于更准确地进行亚型分类。研究人员使用 rMATS 对 PitNETs 进行可变剪接分析,共检测到 143,601 个可变剪接事件,主要富集于外显子跳跃事件(图 1d 和补充数据 3)。约 88% 的剪接基因(n = 13,641)存在不止一个剪接事件(图 1e 和补充数据 3),且事件数量与靶基因表达无关(图 1f)。与先前研究一致,对具有最多剪接变体(≥30 个)的基因进行功能注释发现,这些基因富集于 “GTP 酶调节活性”“蛋白质代谢过程”“氮化合物运输”“细胞连接” 和 “发育过程” 等通路(图 1e)。这些结果共同表明,除基因表达外,PitNETs 展现出更广泛、复杂的剪接模式,且可能具有潜在的功能意义。
剪接失调准确反映 PitNETs 的肿瘤异质性
为探究剪接谱在亚型分类中的作用,研究人员对 264 例 PitNETs 患者和 4 例正常样本的大量 RNA 测序数据进行了差异剪接分析。基于各亚型与其他所有亚型的比较(Wilcoxon 秩和检验,P 值 < 0.001),在跨越三个肿瘤谱系的七个亚型中,共鉴定出 198 个差异剪接事件(图 2a 和补充数据 4)。随后,研究人员采用与差异剪接分析相同的策略,进行了全局亚型特异性差异基因表达分析,共鉴定出 340 个差异表达基因(Wilcoxon 秩和检验,P 值 < 0.001)(补充图 2a)。全局基因表达和剪接特征均能有效识别三大细胞谱系。然而,基因表达特征在区分这些谱系内的亚型时能力有限,而剪接特征表现更优,尤其是在区分更具挑战性的亚型方面(补充图 2c、d 和 3a)。这意味着可变剪接为 PitNETs 亚型的转录组多样性提供了独特信息,且独立于基因表达水平。与先前的临床观察一致,PIT1 谱系亚型的大多数样本(93/103,90%)既表达又分泌激素(补充数据 1)。在 SF1 谱系亚型中,所有样本均表达激素,但无一分泌(91/91,100%)(补充数据 1)。TPIT 谱系亚型的大多数样本(49/58,84%)表达但不分泌激素(补充数据 1),且它们之间的剪接模式存在显著差异。有三个样本在临床诊断中被归类为无功能细胞亚型,所有激素的免疫组化结果均为阴性。但研究人员的分析表明,无功能细胞亚型的剪接特征与沉默 TPIT 谱系患者相似(图 2a),这暗示了无功能细胞亚型的潜在起源。此外,研究结果支持使用一组特定的剪接事件来诊断 PitNETs 的 PG(混合 PRL 和 GH)亚型(图 2a 和补充数据 4)。而且,与 PRL 亚型相比,PG 亚型与 GH 亚型共享更多的常见剪接事件。这些观察结果有助于更好地理解 PG 和无功能细胞亚型的起始和发展过程。基于转录因子的基因表达缺乏区分这些亚组的特异性,而剪接特征则能精确捕捉它们的独特特性。这些结果在另一个独立的 PitNETs 队列中得到了进一步验证(补充图 3b、c)。研究人员观察到,发现队列和验证队列中共享的 166 个剪接事件的剪接异构体包含率(Percentage Spliced In,PSI)变化高度一致(补充图 3e)。与发现队列不同,此处无功能细胞亚型的剪接特征与 SF1 谱系相似,这表明无功能细胞亚型内部可能存在异质性。同样,该验证队列也证实了无功能细胞亚型的剪接模式与非分泌性沉默亚型相似。
越来越多的证据表明,RBP 功能障碍在多种人类疾病的剪接过程中起着关键调节作用。因此,研究人员进一步研究了 1350 种已知 RBP 在 PitNETs 中的表达变化。研究人员在所有亚型中鉴定出 185 个差异表达的 RBP(Wilcoxon 秩和检验,P 值 < 0.001)(图 2b 和补充数据 5)。研究人员还观察到,发现队列和验证队列中共享的 151 个 RBP 的表达变化高度一致(补充图 3f)。值得注意的是,剪接紊乱和 RBP 失调之间存在几乎相同的模式(图 2a、b),且在验证队列中也证实了两者之间的强相关性(补充图 3c、d)。各亚型中这种高度的一致性表明,剪接与 RBP 活性之间存在密切关系。研究人员从每个谱系中确定了前 15 个调控特定剪接模式的 RBP,并基于相关性分析生成了 RBP 与可变剪接事件(Alternative splicing events,ASEs)之间紧密连接的调控网络(图 2c 和补充数据 6)。为进一步验证这些调控关系,研究人员分析了 17 项 RBP 敲低、敲除或过表达研究的 RNA 测序数据。在 82% 的数据集里,至少一半的可变剪接事件与预测的调控模式相符(补充数据 6)。重要的是,研究人员在原发性患者样本中对一些亚型特异性剪接事件进行了实验验证,例如 GH 亚型的 NCAM1、DENND1A 和 FBXO25,PRL 亚型的 EPB41L1 和 ITGB3BP,TSH 亚型的 AKAP8L 和 NFE2L1,GO 亚型的 APP 和 MCF2L,功能性 ACTH 亚型的 ENAH 和 ARFGAP2,以及沉默 ACTH 亚型的 VTI1A、ARFGAP1 和 LSR(图 2d 和补充图 3g)。总之,此项研究利用剪接特征阐明了 PitNETs 亚型的异质性,这是仅靠基于转录因子的特征无法实现的。此外,研究人员还揭示了调控这些剪接紊乱的 RBP 调控网络。
单细胞 RNA 测序证实了 PitNETs 亚型特异性剪接图谱
大量 RNA 测序检测到的可变剪接事件代表了细胞亚群平均后的混合信号,在描绘基本剪接异质性方面能力有限。相比之下,单细胞分析能够更精确地识别每个亚型的肿瘤细胞群,有助于发现不同肿瘤细胞类型以及正常细胞的纯集群内的剪接变化和失调情况。近年来,全长捕获技术的进步显著提高了对整个转录本的读取覆盖率,在单细胞水平检测可变剪接和异构体使用方面具有优势。为进一步在单细胞分辨率下验证 PitNETs 的精确剪接图谱,研究人员对来自 16 个新鲜样本(包括 GH(n = 3)、PG(n = 1)、PRL(n = 2)、TSH(n = 2)、ACTH(n = 3)、GO(n = 2)、无功能细胞亚型(n = 1)和正常垂体样本(n = 2))的细胞进行了全长单细胞 RNA 测序(补充图 4a 和补充数据 7)。经过质量控制,共保留 195,720 个细胞用于后续分析(补充图 4b)。基于标记基因的表达(补充图 4c),通过无监督聚类鉴定出 13 个主要细胞簇,包括周期细胞(Cycling cells,CC)、内皮细胞(Endothelial cells,EC)、巨噬细胞(Macrophage cells,Macro)、T 淋巴细胞(T lymphocyte cells,T cell)、B 淋巴细胞(B lymphocyte cells,B cell)、成纤维细胞(Fibroblasts,Fibro)、PIT1 谱系正常细胞(PIT1-N)、生长激素细胞(Somatotropes,GH)、催乳素细胞(Lactotropes,PRL)、促甲状腺激素细胞(Thyrotropes,TSH)、功能性促肾上腺皮质激素细胞(Functional corticotropes,ACTH)、沉默促肾上腺皮质激素细胞(Silent corticotropes,ACTHsilent)和促性腺激素细胞(Gonadotropes,GO)(图 3a)。作为阳性对照,谱系特异性转录因子基因分别在三个 PitNETs 细胞簇中特异性表达,表明了三个主要的 PitNETs 谱系(图 3b)。来自不同样本的正常细胞始终聚集在一起,表明不存在明显的批次效应(补充图 4d 和 5a)。同时,研究结果显示每个肿瘤细胞簇主要来源于相应亚型的患者,这体现了 PitNETs 的异质性(补充图 4e 和 5b、c)。亚型特异性差异表达基因和富集的分子通路与先前研究结果一致(图 3c、d 和补充数据 8)。这些结果表明,在单细胞水平鉴定出的细胞亚群有效地刻画了各自的亚组特征。
研究人员进一步推断拷贝数变异(Copy number variations,CNVs),以识别每个亚组的肿瘤细胞,用于剪接分析(补充图 5d)。接下来,研究人员旨在验证在大量组织中观察到的亚型特异性可变剪接图谱是否也能在单细胞簇水平重现。为此,研究人员重新审视了在大量组织中鉴定出的剪接事件,仅选择在单细胞剪接分析中也能检测到的事件。然后,研究人员计算了这组剪接事件在 PitNETs 每个细胞群体中的 PSI 值。结果发现,单细胞簇之间复制出了相同的剪接模式,且与肿瘤亚型之间完美匹配,这表明可变剪接变化在每个异质性肿瘤克隆内具有高度特异性(图 5a 和补充数据 4)。在各种可变剪接类型中均观察到显著的剪接变化,其中盒式外显子事件是最常见的改变,包括 NCAM1、ITGB3BP、KHDRBS1、ENAH、ARFGAP1 和 MCF2L 等基因的变化(图 4b)。与在大量样本水平的观察结果相似,对单细胞簇中 RBP 表达的分析也揭示了与可变剪接变化相匹配
下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究
10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!
欢迎下载Twist《不断变化的CRISPR筛选格局》电子书
单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析
下载《细胞内蛋白质互作分析方法电子书》