基于综合多组学绘制髓母细胞瘤中天然呈递的 T 细胞抗原图谱
髓母细胞瘤是儿童中最常见的恶性原发性脑肿瘤。尽管综合基因组学在近期取得了进展,但高危髓母细胞瘤患儿的预后仍然很差,需要新的肿瘤特异性治疗方法。在此,[第一作者单位] 的研究人员展示了髓母细胞瘤中天然呈递的 T 细胞抗原图谱。研究人员绘制了 28 个肿瘤的人类白细胞抗原(HLA)呈递肽组,并与内部良性数据库进行了比较免疫肽组分析。结果显示,髓母细胞瘤是肿瘤相关抗原的丰富来源,这些抗原天然呈递在 HLA I 类和 II 类分子上。值得注意的是,大多数肿瘤相关肽和蛋白质是亚组特异性的,而在髓母细胞瘤的所有亚组(WNT、SHH、3 组和 4 组)中共同呈递的情况很少见。对排名靠前的新型候选抗原进行的功能测试表明,它们能够诱导肽特异性 T 细胞反应,这支持了其在 T 细胞免疫治疗中的潜力。这项研究深入绘制了髓母细胞瘤中天然呈递的 T 细胞抗原图谱。免疫肽组学、转录组学和表观遗传学数据的整合,使得研究人员鉴定出了大量可作用的靶点,这些靶点可通过促进为髓母细胞瘤患儿设计明智的免疫治疗方法,进一步转化到临床应用中。
中枢神经系统(CNS)肿瘤仍然是儿童癌症相关死亡的主要原因。髓母细胞瘤是一种极具侵袭性的儿童原始神经外胚层肿瘤,也是儿童中最常见的恶性中枢神经系统肿瘤,占所有颅内肿瘤的 25%。
在过去的二十年中,大规模的基因组研究极大地推动了 [研究人员] 对髓母细胞瘤的理解,并有助于阐明髓母细胞瘤的分子基础,包括具有生物学和临床相关性的肿瘤间异质性。将分子亚组整合到世界卫生组织(WHO)分类中,凸显了分子风险分层在髓母细胞瘤患者中的重要性,并呼吁开发新的肿瘤亚型特异性治疗方法。化疗和颅脊髓照射等非特异性的 “一刀切 ” 治疗方式,对于具有生物学异质性、且各亚组肿瘤反应模式不同的肿瘤群体来说,似乎针对性和适应性不足。免疫治疗是一种极具吸引力的治疗方式,它可以优化对肿瘤细胞的靶向作用,同时保护儿童发育中的脆弱脑组织。
基于 T 细胞的免疫治疗的一个前提条件,是肿瘤相关肽由人类白细胞抗原(HLA)呈递。开发针对髓母细胞瘤的有效免疫治疗方法的一个主要障碍,是对这种肿瘤实体的天然抗原景观存在认知差距。
在此,[第一作者单位] 的研究人员展示了髓母细胞瘤的 T 细胞抗原景观。一种综合多组学的抗原发现流程,通过与内部良性免疫肽组数据库进行比较分析,能够鉴定出一组仅在天然肿瘤组织上呈递的 T 细胞靶点。排名靠前的候选肽在功能性 T 细胞试验中进一步验证,以研究其在基于 T 细胞的免疫治疗中的潜力。
结果
患者特征
本研究基于深入的免疫肽组分析、候选肽选择,这些候选肽源自综合多组学和功能性免疫原性测试(图 1a)。[研究人员] 提供了髓母细胞瘤(n=28)的 T 细胞抗原图谱,包括一组新的与髓母细胞瘤相关的抗原,这些抗原天然呈递在 HLA I 类和 II 类分子上,并且对排名靠前的候选抗原进行了体外免疫原性测试。
[研究人员] 纳入了 28 名患者,诊断时的中位年龄为 8 岁(范围:17 个月至 37 岁)。男女比例为 3:2。临床病程和治疗数据见图 1b。28 个髓母细胞瘤样本的分子亚组注释见补充表 1。每位患者和样本的特征,包括 HLA 分型和用于 HLA 免疫沉淀(IP)的可用样本质量,列于补充表 2。术前磁共振图像见补充图 1。
绘制天然呈递的 HLA I 类肽的抗原景观,揭示髓母细胞瘤相关抗原
对髓母细胞瘤肿瘤样本(n=28)的 HLA 配体组分析,鉴定出 9821 种不同的来源蛋白,这些蛋白由天然肿瘤组织上的 HLA I 类肽代表(占估计可获得的不同来源蛋白最大量的 91%,图 2d)。尽管观察到髓母细胞瘤的 HLA I 类肽组与内部良性数据库之间有相当大的重叠,但 77 种蛋白的肽仅在至少两个髓母细胞瘤样本中呈递(图 2f)。经过进一步的人工整理,包括对 HLA 基序的潜在肽进行质量控制,以及减去映射到多个来源蛋白的肽,研究人员创建了一组 15 种与髓母细胞瘤相关的蛋白,以及在 11%-29% 的肿瘤中天然呈递的相应肽。其中,SPINK8、WNT5A 和 SHISA9 最为常见(图 2g)。SPINK8 在 SHH、3 组和 4 组中均有呈递,WNT5A 在 WNT、SHH 和 4 组中呈递,SHISA9 在 3 组和 4 组肿瘤样本中发现。SLC22A1 仅在 3 组和 4 组中呈递。没有一种与髓母细胞瘤相关的 HLA I 类来源蛋白在所有亚组中都存在,这突出了分子亚组特异性抗原发现的必要性。肽序列及其 HLA 限制、阳性患者样本列表以及相应来源蛋白的 GTEx 图谱,可从补充表 4 中获取。值得注意的是,没有一种与髓母细胞瘤相关的 HLA I 类蛋白表现出癌睾丸抗原(CTA)样的基因表达谱。
DNA 甲基化分析确定髓母细胞瘤的主要分子亚组
从所有肿瘤样本中获取了 DNA 甲基化图谱。基于使用海德堡脑肿瘤甲基化分类器进行的分子分类,根据最可靠的分类器预测,28 例患者样本分类如下:WNT(n=4)、SHH(n=9)、3 组(n=7)、4 组(n=8)(图 1c)。各亚组特异性染色体增减的柱状图见图 1d;每个肿瘤样本的拷贝数变异(CNV)见补充图 2。
绘制髓母细胞瘤的抗原景观,产生了大量天然呈递的 HLA I 类和 II 类肽
分子 HLA 表达是免疫肽组分析的前提条件,[研究人员] 通过免疫组织化学对其进行了评估。在 HLA I 类和 II 类分子上均检测到强烈的膜染色,每个分子亚组均展示了一个示例(图 1e;患者 4/WNT、患者 9/SHH、患者 18/3 组、患者 25/4 组)。
从 28 个速冻肿瘤样本中提取了与 HLA I 类和 II 类结合的肽。研究队列包括 60 种不同的 HLA I 类等位基因,覆盖了 99.95% 的世界人口,预计 92.08% 的个体至少对三种等位基因呈阳性(补充图 3)。髓母细胞瘤患者中最常见的等位基因是 HLA-A02:01(39%)、-A03:01(32%)和 - C*06:02(32%)(补充表 3)。
对与髓母细胞瘤相关的 HLA I 类呈递肽的分析,产生了 32,199 种不同的 HLA I 类配体,占估计可获得的最大覆盖范围的 75%(图 2e)。减去内部良性数据库后,在至少两个肿瘤上发现了 1963 种与髓母细胞瘤相关的肽(图 2h)。经过人工整理后,定义了一组来自 38 种蛋白、并在 18%-29% 的肿瘤上呈递的 34 种肽。其中,最常见的 HLA I 类肽来源于 GFAP、HNRNPK、SNX14、AGRN、DNMT3A、KIF1A 和 GABRG2。考虑到不同的亚组,有 4 种肽被证明是泛髓母细胞瘤靶点,在所有亚组中均有呈递。有 2 种 HLA I 类肽仅存在于 WNT 和 SHH 亚组的免疫肽组中,而 2 种 HLA I 类肽仅在 3 组和 4 组中呈递。1 种 HLA I 类肽仅在 SHH 亚组(5 个样本)中呈递。与髓母细胞瘤相关的 HLA I 类肽的肽序列、其 HLA 限制、阳性患者列表以及相应的来源蛋白,列于补充表 5。
每个样本中鉴定出的 HLA I 类肽中位数为 2016 [88-5867],HLA II 类呈递肽中位数为 1347 [400-4164]。HLA I 类肽洗脱液的纯度至少为 70%。没有样本因肽产量低或 HLA I 类配体百分比低而被排除。每个样本中独特的 HLA I 类和 II 类肽的总数,以及 HLA I 类肽洗脱液的纯度(预测与 HLA 结合的肽的比例),见图 2a。HLA I 类肽的长度分布在 9 个氨基酸长度处达到峰值(图 2b),而 HLA II 类呈递肽通常为 13-18 个氨基酸(图 2c)。除了从速冻组织中洗脱的 HLA I 类配体外,样本质量与产生的肽数量之间的相关性较差(补充图 4)。
根据天然免疫肽组的免疫关键水平定义肿瘤相关性
单个基因 / 蛋白质的前体(RNA 和蛋白质)丰度与 HLA 肽之间的总体相关性较差,这限制了基于 RNA 测序或蛋白质数据对 HLA 肽进行计算机预测,因此需要对免疫肽组进行直接分析以发现抗原。因此,[研究人员] 进行了深入的免疫肽组分析,通过在包含 30 种不同人类原发性器官的内部良性数据库(n=418 个 HLA I 类肽组数据集,包括 HLA 配体图谱等;
www.hla-ligand-atlas.org)中对患者样本进行比较分析来鉴定靶点。髓母细胞瘤相关的肽和相应的来源蛋白,是指在中枢神经系统组织(即脑、小脑和脊髓)中未被鉴定出,且在良性数据库中最多只有一个非中枢神经系统相关样本呈阳性的肽和蛋白。作为选择癌症免疫治疗靶点的额外标准,[研究人员] 报告了每个候选蛋白基因在大量良性人类组织中获得的、并存储在 GTEx 数据库(
www.gtexportal.org)中的 RNA 表达数据。在正常组织中基因表达缺失或低表达(定义为每百万转录本数少于 10 个,TPM)的、检测到的 HLA 肽的来源蛋白,被视为潜在候选蛋白。
将源自 HLA I 类呈递的髓母细胞瘤相关蛋白的肽列表(补充表 4),与被指定为髓母细胞瘤相关的 HLA I 类肽列表(补充表 5)相结合,得到了 n=66 个用于癌症免疫治疗的候选靶肽。考虑到所有靶点的 HLA 等位基因限制,这些靶肽覆盖了 98.64% 的世界人口(图 2i),预计每位患者平均有 14 种肽匹配。各国的人口覆盖率见补充图 5。
绘制 HLA II 类配体组图谱,鉴定髓母细胞瘤相关蛋白和肽
对髓母细胞瘤的 HLA II 类肽组分析,鉴定出 4922 种不同的来源蛋白,这些蛋白产生 HLA II 类限制的肽(占估计可获得的不同蛋白最大数量的 71%,图 3a)。尽管与良性样本有很大的重叠,但有 60 种蛋白仅在至少两个肿瘤中呈递(图 3c)。在对潜在肽的长度、长度变异的存在以及映射到多个来源蛋白的情况进行人工整理后,研究人员创建了一组 10 种与髓母细胞瘤相关的蛋白,以及在 11%-36% 的肿瘤中天然呈递的相应肽。其中最常见的是 IGFBPL1、CBX4、ESCO1、SYCP3 和 CCDC59(图 3d)。没有一种与髓母细胞瘤相关的 HLA II 类蛋白在所有亚组中都被鉴定出来。10 种肿瘤相关蛋白中有 6 种在成人和儿童髓母细胞瘤中通过 HLA II 类呈递(IGFBPL1、CBX4、ESCO1、CCDC59、PCDH20、CGGBP1),尽管本研究人群中仅包括两名成年人。肽序列、阳性患者列表以及相应来源蛋白的 GTEx 图谱,可从补充表 4 中获取。这些肿瘤相关的 HLA II 类蛋白中,有一种(SYCP3)表现出 CTA 样的表达谱,相关的 SYCP1 列在 CT 数据库中。
在肽水平上,从髓母细胞瘤(n=28)中洗脱了 25,076 种不同的 HLA II 类呈递肽,获得了估计可达到的最大覆盖范围的 66%(图 3b)。由于比较分析无法反映长度变异和共同核心序列,[研究人员] 旨在对共享核心序列的肽进行分组。因此,在比较分析之后,所有由至少一种肿瘤相关的 HLA II 类呈递肽代表的蛋白,都进行了 “热点 ” 分析(图 3e)。髓母细胞瘤相关的 HLA II 类呈递热点被定义为长度至少为 8 个氨基酸,且在至少 5 名患者中鉴定出的肽覆盖、同时在良性样本中没有匹配序列的区域。这产生了一组 11 种在肿瘤组织上独特呈递区域的蛋白,肽特异性频率高达阳性免疫肽组的 43%。有两个热点靶点在所有髓母细胞瘤亚组(WNT、SHH、3 组和 4 组)的免疫肽组中均有呈递。肽序列、阳性患者列表以及相应的来源蛋白,见补充表 6。
对髓母细胞瘤相关的 HLA I 类(n=15)和 II 类代表的来源蛋白(n=10),以及髓母细胞瘤相关的 HLA I 类(n=38 种来源蛋白)和 II 类限制的肽(n=11 种来源蛋白)进行比较分析,揭示了 HLA I 类和 II 类肽组本质上独特的抗原库。值得注意的是,与髓母细胞瘤相关的来源蛋白 IGFBPL1、INSM1 和 INSM2,均产生了 HLA I 类和 II 类呈递的候选靶肽。使用 “BrainSpan:发育中大脑图谱”(
https://brainspan.org/rnaseq/search/index.html)评估了髓母细胞瘤相关靶点在健康发育大脑中的基因表达水平。作为概述的热图(补充图 6 a-d)显示,靶点在周围发育大脑中的基因表达总体较低,详细的绝对基因表达数据可作为补充获取(补充数据 1-4)。
基因本体和网络分析显示,泛癌儿科和髓母细胞瘤基因集富集
基于基因本体(GO)术语的功能注释显示,与 HLA II 类相比,HLA I 类呈递的 HLA 配体来源蛋白的基因,在细胞区室、分子功能和生物学过程方面存在差异(补充图 7 和 8)。此外,将癌症基因网络与 HLA I 类配体来源蛋白的潜在基因进行比较,排名前两位的富集基因集是 “泛癌儿科” 和 “髓母细胞瘤”(图 4a;补充数据 5),这表明检测到的候选靶点具有生物学相关性。涉及的基因以及富集术语之间的重叠,在基因概念网络(CNET)图中展示(图 4b)。
已建立的 CTA 和 TAA 识别率较高,但总体呈递频率较低
考虑到总共 366 种选定的 CTA 和肿瘤相关抗原(TAA),以及 16 种据报道与髓母细胞瘤相关的蛋白(其中 15 种与 CTA 和 TAA 的一般列表重叠),[研究人员] 在从髓母细胞瘤获得的当前免疫肽组数据集中,筛选了先前发表的肿瘤抗原。其中,分别有 n=117 和 n=84 种由 HLA I 类和 HLA II 类呈递的肽代表。尽管识别率相对较高,但 CTA 和 TAA 的呈递频率较低,尤其是那些仅在髓母细胞瘤中鉴定出的抗原。在满足上述被指定为肿瘤相关抗原标准的 HLA I 类呈递的 TAA 和 CTA 中,没有一种在超过一个样本中被鉴定出来,而其中 16 种由至少在两个、最多在四个肿瘤上的髓母细胞瘤相关 HLA I 类肽代表。在 HLA II 类中,有 13 种蛋白仅在髓母细胞瘤的肽组中被鉴定出来,只有 RAD51 和 GPC2 在两个肿瘤中被发现。另有 8 种 CTA 和 TAA 由肿瘤相关的 HLA II 类呈递肽在 7%-14% 的样本中代表(图 4c,补充表 7)。
髓母细胞瘤的转录组分析揭示了靶抗原的亚组特异性差异表达,并描绘了免疫微环境特征
对整个队列进行的批量 RNA 测序显示,样本根据其 DNA 甲基化亚组进行聚类(图 5a),从而正交验证了亚组注释,并突出了转录组数据的质量。一种多组学方法将 HLA 配体组水平与转录组数据联系起来,整合了肽水平(图 5b)和来源蛋白水平(图 5c)排名靠前的靶抗原的差异基因表达。除了 HLA II 类来源蛋白外,研究人员发现大部分靶抗原存在亚组特异性差异基因表达。关于 HLA 配体组和转录组整合的亚组个体比较,以环形图和火山图展示(补充图 9a,b)。基于基因表达的细胞组成反卷积分析显示,肿瘤微环境的免疫细胞群体中,淋巴细胞和髓样细胞的