简介 肿瘤细胞中的基因融合是一类主要由基因组易位、插入、缺失或染色体反转引起的分子畸变。 相当大比例的融合基因驱动肿瘤发生和/或促进肿瘤进展,例如 BCR-ABL1型 ( 1), ETV6-NTRK3 ( 2),和 TMPRS2型 - ETS公司 ( 三)由于其肿瘤特异性表达和驱动肿瘤病理生理学的能力,融合基因是具有巨大诊断和治疗潜力的靶分子( 4, 56– 9)然而,这些癌症融合基因的功能影响和临床相关性仍知之甚少,这是实现精确癌症医学的关键知识缺口。
许多计算算法已经被发展来预测体细胞点突变的功能影响( 10).这些算法的开发和验证得益于一组功能特征突变的“金标准”( 11)相比之下,识别驱动基因融合的计算算法的开发和验证受到限制,至少部分原因是缺乏一套功能性特征融合基因的黄金标准集。 目前的研究集中在一小组高复发率的基因融合上,以获得详细的功能和机制特征。 虽然这是一个合理的做法,以确定目标,可以最大限度地潜在的临床影响,这种方法导致许多罕见的基因融合尚未探索。 此外,传统的实验研究只能以耗时和昂贵的方式描述少量的基因融合,这不足以解决临床环境中告知治疗方案的需要。 这在很大程度上是由于在敏感和可靠的功能分析中难以创建、表达和描述大量特定基因融合。
在这项研究中,我们开发了一种有效的功能基因组学方法 来描述基因融合的细胞后果,并将其应用于大量的融合基因。 我们进一步对受体酪氨酸激酶(RTK)–RAS信号通路中涉及的融合进行了深入的分析,包括它们的功能后果和潜在的治疗责任。 我们的方法展示了一种潜在的方法来填补基于序列的融合检测和基于目标的临床行为之间的空白。
结果 研究概况 为了确定临床上可操作的基因融合以实现精确的肿瘤学,我们开发了一种有效的功能基因组方法来评估基因融合对功能的影响,并将其应用于在TCGA患者样本中检测到的融合基因( 图1A6, 8)我们选择了110个基因融合(主要来自TCGA列表和MD-Anderson患者的另一组),并考虑了它们的相关途径和参与的伴侣基因的潜在药物性。 我们用先前描述的第二种融合技术构建了一种多片段融合技术( 12)通过直接测序相应的质粒来验证融合构建物的质量。 我们只包括那些通过了质量控制步骤的构造,以便进行后续评估。 第三,对于每个融合基因,我们通过在信息者细胞系(即Ba/F3和/或MCF10A)中的体外实验来评估其对细胞活力的影响。 对于选定的候选人,我们还进行了异种移植瘤检测,以评估其体内致瘤活性。 最后,对于上述阳性结果,我们进行药物反应分析以确定其治疗意义。
图1 我们的功能基因组学方法概述和融合候选分析。
( A )融合基因功能基因组学平台示意图。 开放阅读框1; 绿色荧光蛋白**** P trans data-src=" 0.0001. "<0.0001。( B )90个基因融合的靶标分类。 TClin,至少含有一种FDA批准药物的基因; trans data-src="TChem, genes with at least one ChEMBL compound with an activity cutoff of 30 nM; "具有至少一种ChEMBL化合物的基因,其活性截止值<30nm;以及TBio,没有已知药物或小分子活性的基因。 ( C )FASMIC的快照:基因融合数据门户。
我们总共获得了90个融合的高质量功能数据(表S1)。 为了说明融合伙伴基因的临床相关性,我们使用Pharos数据库对每个伙伴基因进行了注释,这是一个解释可药物基因组的知识库( 13)在90个融合基因中,44个(48.9%)融合至少有一个伴侣被归类为TClin,这与至少一个美国食品和药物管理局(FDA)批准的药物有关; trans data-src="33 (36.7%) contained TChem targets, which had at least one ChEMBL compound with an activity cutoff of 30 nM; "33例(36.7%)含有tcem靶点,其中至少有一种ChEMBL化合物的活性截止值<30nm;13例(14.4%)融合没有与已知药物或小分子活性相关的伴侣,注释为TBio( 图1B)。值得注意的是,我们的融合中没有一个双方都被注释为TDark,而在法罗斯中,没有什么东西是已知的。
为了促进广泛的生物医学社区利用我们的成果,我们开发了一个用户友好的网站,用于数据可视化和探索( 图1C)数据门户包含五个模块:(i)“功能注释”提供与特定基因融合相关的实验数据,包括细胞活性和药物反应分析; (ii)“融合图”以直观的图形显示融合基因结构,并标注位置和蛋白质域信息; (iii)“融合频率”显示不同癌症类型融合发生的频率; (iv)“功能预测”显示融合的预测功能影响得分; (五)“文献综述”展示了文献中有关融合的功能和临床证据。 用户可以通过关键词轻松搜索感兴趣的基因融合,或者下载所有数据进行分析。 数据门户位于 https://bioinformatics.mdanderson.org/public-software/fasmic/.
肿瘤融合基因的大规模功能注释 在我们的功能基因组学方法中,我们主要使用Ba/F3细胞作为“信息者”细胞系来评估特定基因融合对细胞活力的影响。 Ba/F3是一种依赖白细胞介素-3(IL-3)促进生长和增殖的小鼠前B细胞系,但在发生致癌事件时可轻易转化为IL-3独立性,因此被广泛用于检测致癌事件( 14)检测Ba/F3成瘾从IL-3向癌基因转移的能力已经被用来研究多种癌基因的活性和治疗敏感性( 15– 17)根据基因融合与阴性对照(mCherry和/或荧光素酶)相比是否表现出激活效应,我们将90个基因融合分为两个功能类别:24个激活融合和66个无明显效果的融合。 由于表型效应可能取决于细胞环境,我们使用MCF10A对Ba/F3细胞系进行了类似的细胞活性检测,但没有任何影响。MCF10A是一种非肿瘤性乳腺上皮细胞系,广泛用于非锚定非依赖性生长检测,以定量转化活性。 我们随机选择了30个在Ba/F3分析中没有明显效果的融合,发现它们在MCF10A中没有激活,这表明我们平台的假阴性率很低。 此外,我们还通过对两个模型细胞系(Ba/F3和MCF10A)的基因过度表达分析,评估了132个野生型基因的功能影响。 通过与我们的融合注释重叠,24个激活融合中的14个(58.3%)至少有一个伴侣基因对细胞活力有积极(激活)作用,而66个无效应融合中只有9个(13.6%)有一个具有正效应的伴侣基因。 这种模式表明激活的融合倾向于涉及具有致癌潜力的基因(χ 2 测试, P =5.7×10 ? 5 ; 图2A)在90个融合基因中140个独特的伴侣基因中,最常见的4个融合伙伴基因分别是 RET公司 , FGFR2型 , 吹牛 ,和 阿尔克 。例如,五分之四 RET公司 融合,五分之三 阿尔克 融合,两者兼而有之 NTRK2 融合在报告细胞系中显示激活活性。 在复发性融合中,16例出现于多种癌症类型,其中 FGFR3-TACC3 , ETV6-NTRK3 ,和 EML4-ALK公司 在最热门的激活点击中( 图2B)在tcxon试验组中,wilxon效应明显高于tcxon组, P =2.9×10 ? 2 ),这与癌性融合很可能是阳性选择的观点一致。 虽然高复发率的基因融合更有可能对功能产生影响,但我们的结果表明,相当大比例的低频或单基因融合是潜在的驱动事件,可能对特定肿瘤至关重要,并具有治疗效果。
图2 .癌症基因融合的大规模功能注释综述。
( A )在激活融合和无效应融合中显示激活效应的伴侣基因的比例。 P 值基于卡方检验。 ( B )与特征性复发融合相关的TCGA样本数(左)和癌症类型(右)(在 ≥ 2个样品)。 激活的熔丝用红色标记; 否则,用蓝色。 P 值基于威尔科克森检验。 ( C )激活融合与无效应融合的中心度评分比较。 P 值基于威尔科克森检验。 ( D )激活融合与无效应融合在同一染色体或不同染色体上伴侣基因的分布。 P 基于卡方检验的值。
为了深入了解激活融合基因的系统级特性,我们将我们基于实验的功能注释与基于生物网络中融合伙伴基因特性的计算方法预测的优先级分数进行了比较( 18).中心性得分高的融合在我们的方法识别的激活融合中显著丰富,突出了我们的实验方法与计算预测的一致性(Wilcoxon检验, P =2.4×10 ? 三 ; 图2C)在所检测的融合基因中,有50个融合基因(55.6%)位于同一染色体上。 我们进行了富集分析,以评估融合的功能效应是否与其伴侣基因之间的距离相关。 激活融合倾向于有来自不同染色体的基因伴侣(χ 2 , P =5.1×10 ? 三 ; 图2D)这可能是因为转录通读导致的顺式融合(来自同一染色体或相邻基因的基因伴侣)更可能是乘客事件。
RTK-RAS信号通路中的基因融合 RTK-RAS通路在不同的癌症类型中经常被破坏,据估计多达40%的肿瘤在RAS家族的基因中有异常( 19).在我们检测的融合中,近一半(42个融合)至少有一个来自RTK-RAS途径的伴侣基因,因此,我们将重点放在该途径上进行深入分析(我们测试的基因融合被突出显示; 图3A)在TCGA PanCanAtlas数据集的基础上,我们对RAS途径成员的基因融合进行了系统分析,包括272个基因,主要由RAS倡议定义( 20)在9105例TCGA肿瘤中,1289例(14.2%)肿瘤至少有一例融合( 图3B)RAS途径融合率最高的是肉瘤(平均每个肿瘤0.8个RAS通路融合)、卵巢癌(0.6)和胶质母细胞瘤(0.6),最低的是肾癌(0.02)和胸腺瘤(0.02)。 特别是,297个肿瘤包含一个或多个RAS通路融合,而RAS通路成员没有突变。 这些肿瘤可能携带已知癌基因的融合,如 阿尔克 ( TPM1-ALK公司 ), FGFR3型 ( FGFR3-ELAVL3 ), 吹牛 ( MACF1-BRAF公司 ),和 AKT3 ( ACV2RA-AKT3、ZEB2-AKT3 )以及可能影响RAS抑制剂功能的融合( 拉萨尔2 和 SPRED2公司 )RAS调节肿瘤抑制基因( PTEN,RB1 , TP53型 , 雷达52 ,和 FANC公司 )结果表明,这些融合通过激活RTK-RAS通路在肿瘤的发生和/或维持中发挥作用。 在992例RTK-RAS通路中同时发生突变和融合的肿瘤中,我们观察到了已知的复发激活融合基因的病例,例如 EML4-ALK公司 肺腺癌和 FGFR3-TACC3 膀胱肿瘤。 这项观察表明,这些肿瘤中的融合基因可能与RAS通路成员的点突变合作,而不是代表乘客事件。 例如,我们能够证明 轨道1-RAF1 黑色素瘤患者的基因融合 表皮生长因子受体 , NF1型 , PAK3 , 皮克3CG , PIK3R6 ,和 PLCE1号机组 因此,与突变同时发生的先前未确认的融合子集也可能对激活RTK-RAS信号作出显著贡献。
图3 RTK/RAS途径融合基因分析总结。
( A )所有42个RTK/RAS融合在实心矩形框中突出显示,括号内的数字表示所分析的相应基因融合的数量。 ( B )总结33种TCGA癌症类型的所有肿瘤,包括携带RTK-RAS途径基因融合和/或突变的病例( n =9105)。 色差的存在显示在 是的 轴,而所有患者都显示在 十 轴心国。 颜色表示肿瘤类型。 灰色表示没有RTK-RAS像差。 ( C )二部网络显示了不同癌症类型的每个融合家族的发生情况。 每个边缘的宽度与包含连接融合的患者数量成比例。
图3C显示了我们在TCGA患者队列中分析的42个基因融合的频率摘要( n =9105)。 明确地, FGFR公司 (五) FGFR2型 还有两个 FGFR3型 融合)的融合频率最高( n =44),在13种癌症类型中检测到,以及 NTRK公司 熔合(两个 NTRK2 三次NTRK3融合; n =12)发生在五种癌症类型中。 在这些基因融合中, 阿尔克 , 吹牛 , RET公司 ,和 FGFR公司 是最常见的伴侣基因,每个都有5个融合,因此,我们详细讨论了它们。
阿尔克 基因融合 阿尔克 [编码间变性淋巴瘤激酶(ALK)酪氨酸激酶受体]基因融合在多种实体瘤中已有报道( 21)。在下列情况下 EML4公司 以及其他 阿尔克 基因融合,5′伴侣卷曲螺旋结构域的二聚化导致酪氨酸激酶功能的激活 阿尔克 ( 22).除了 ALK-EML4型 肺癌和其他癌症的重排, TPM1-ALK公司 在膀胱癌中也有发现。 我们发现了 TPM1-ALK公司 在RNA水平上成熟的mRNA框架转录物,这被不一致的成对末端阅读所证实,这表明在 TPM 1 和 阿尔克 地点。 通过这个事件,大部分的编码序列 TPM 1 ,包括其螺旋线圈结构域,融合到 阿尔克 包括它的蛋白激酶结构域( 图4A).
图4 .影响 阿尔克 细胞活性和药物反应的融合。
( A )基因组结构示意图和mRNA转录本 TPM1-ALK公司 融合基因。 这两个基因的断点都用连接箭头表示。 在外显子水平上说明了与肿瘤类型中表达水平相关的mRNA表达水平。 红色条表示编码酪氨酸激酶结构域的外显子。 ( B )Ba/F3细胞存活试验 TPM1-ALK公司 (平均发光,误差条表示SD, n =3)与阳性对照相比, EML4-ALK公司 .GFP=阴性对照。 ( C )基于定量PCR的野生型全长表达 TPM 1 和 阿尔克 以Ba/F3表示(平均表达倍数变化标准化为父母阴性对照,误差条表示SD, n =3)。 ( D )全长野生型Ba/F3细胞存活试验 TPM 1 和 阿尔克 与 TPM1-ALK公司 (平均发光,误差条表示SD, n =3)。 ( E )免疫印迹 TPM1-ALK公司 和 EML4-ALK公司 Ba/F3的表达及信号通路的激活。 箭头表示正确的尺寸 阿尔克1 TPM 和 EML4-ALK公司 . ( F )Ba/F3细胞表达的剂量依赖性生存分析 TPM1-ALK公司 用crizotinib治疗72小时(细胞存活率的平均百分比,误差线表示SD, n =4)。 ( G )克赖替尼对不同细胞系药物敏感性的比较 阿尔克 融合。 P 值基于威尔科克森检验。 ( H 和 我 )环唑替尼药物敏感性与药物敏感性的相关性分析 阿尔克 细胞系中的基因表达 阿尔克 熔合(H)或无 阿尔克 熔合(I)。 曲线下面积。 ( J )NVP-TAE684细胞系与不加药的药物敏感性比较 阿尔克 融合。 ( K 和 我 )NVP-TAE684药敏与药物敏感性的相关性分析 阿尔克 细胞系中的基因表达 阿尔克 熔合(K)或无 阿尔克 熔合(L)。 (B和D)全部 P 数值计算方法 t 试验; ns,不显著**** P trans data-src=" 10"<10岁? 4 (G至L)药物数据:CTRPv2。 RSEM,RNA序列通过期望最大化。
接下来我们评估了 TPM1-ALK公司 基因融合在我们的Ba/F3细胞活性检测中的应用。 TPM1-ALK公司 与表达绿色荧光蛋白(GFP)的细胞相比,Ba/F3细胞的存活和增殖增强了70倍( P trans data-src=" 10"<10岁? 4 )早在去除IL-3后7天( 图4B)并对其全长转化活性进行了评价 TPM 1 和 阿尔克 在Ba/F3分析中。 尽管定量聚合酶链反应(PCR)验证表达( 图4C)也没有 TPM 1 也没有 阿尔克 与融合基因的表达相比,表达能够促进Ba/F3的存活和增殖( 图4D). TPM1-ALK公司 促进细胞生长的水平相当于 EML4-ALK公司 ( 图4B),提示其相关的活性,这进一步得到了它们通过信号转导子和转录激活子3(Stat3)的类似和强大的信号激活的支持,通过对生长期Ba/F3细胞裂解物中磷酸化Stat3(Y705)的免疫印迹分析来评估( 图4E)我们接下来进行Ba/F3剂量反应分析,以检查 TPM1-ALK公司 去碱抑制剂。 Ba/F3细胞表达 TPM1-ALK公司 对克立替尼[中抑制浓度(IC)有明显的敏感性 50 )=16.5nm],一种ALK激酶抑制剂,临床用于治疗ALK阳性肺癌患者( 23),与对照细胞相比( 图4F).
概括 阿尔克 融合上述对ALK抑制剂的敏感性,我们比较了crizotinib和另一种ALK抑制剂NVP-TAE684在有或没有ALK抑制剂的细胞系样本之间的公共细胞系药物敏感性数据 阿尔克 融合后发现 阿尔克 融合对ALK抑制剂更敏感(crizotinib,Wilcoxon试验, P =1.4×10 ? 4 ; 图4G; 和NVP-TAE684,Wilcoxon测试, P =9.0×10 ? 5 ; 图4J)。我们接下来评估 阿尔克 通过细胞系的表达观察到 阿尔克 熔合增加了 阿尔克 表达式(Wilcoxon检验, P =2.2×10 ? 6 ; 图S1A)。 虽然 阿尔克 在有或无ALK抑制剂的细胞系中,表达水平与药物敏感性显著相关 阿尔克 融合,内部的关联 阿尔克 融合细胞系( R ) = ? 0.72和NVP-TAE684,皮尔逊 R = ? 0.74; 图4,H和K]比没有 阿尔克 融合(crizotinib,Pearson's R = ? 0.52和NVP-TAE684,皮尔逊 R = ? 0.50; 图4,I和L,以及图S1、B和C),表明 阿尔克 融合, 阿尔克 表达在预测ALK抑制剂的反应方面更为有效,并且可能表现出更大的依赖性 阿尔克 作为一名司机。 总的来说,这些结果突出了 阿尔克 融合作为对ALK抑制剂反应的有前景的预测标记物。
皇家空军一号 和 吹牛 熔合 以前的研究报告了一些 吹牛 (B-Raf原癌基因,丝氨酸/苏氨酸激酶)和 皇家空军一号 黑色素瘤、甲状腺癌和前列腺癌(Raf-1原癌基因、丝氨酸/苏氨酸激酶)基因与不同伴侣的融合( 24)。我们的分析确定 布拉夫/RAF1 与多个伴侣的融合,其中包括已知的基因融合 税号1BP1-BRAF 和 轨道1-RAF1 黑色素瘤( 7, 25).研究 吹牛 / 皇家空军一号 综合考虑,除了以上两个融合,我们又选择了三个 吹牛 / 皇家空军一号 TCGA队列中保留完整蛋白激酶结构域的融合: CLCN6-RAF1 (TCGA-ER-A19L), CDC27-BRAF公司 (TCGA-FS-A1ZU),以及 ATG7-BRAF公司 (TCGA-BF-A5EP)(图S2)。 我们的Ba/F3分析显示出强劲的驱动因素活性,从30到142倍不等( P trans data-src=" 10"<10岁? 4 )与表达GFP的细胞相比,在缺乏IL-3的情况下( 图5A). 吹牛 Ba/F3的融合活性与表达癌基因的细胞相似 吹牛 V600E型 ,在热点V600的一个特征性的致癌事件,在46%的黑色素瘤样本中发现( 25).对体外生长的Ba/F3细胞裂解物进行免疫印迹分析 皇家空军一号 和 吹牛 通过细胞外信号调节激酶1/2(ERK1/2)(T202/Y204)的磷酸化来评估融合表达和增强的丝裂原活化蛋白激酶(MAPK)信号,其也被 吹牛 V600E型 但不是GFP控制( 图5B).与之前的观察结果一致,存在 吹牛 和 皇家空军一号 基因融合与激活相互排斥 吹牛 / RAS公司 70%的黑色素瘤患者都有突变(Fisher精确检验, P =0.018; 图5C) ( 7, 25),进一步支持了这些融合代表了这种疾病的司机事件。
图5 .影响 皇家空军一号 和 吹牛 细胞活性和药物反应的融合。
( A )Ba/F3细胞存活试验 皇家空军一号 和 吹牛 熔合(平均发光,误差线表示SD, n =每组3个)。 吹牛 V600E型 =阳性对照,GFP=阴性对照。 ( B )免疫印迹法检测Ba/F3中RAF1和BRAF融合表达及MAPK信号激活。 ( C )TCGA黑色素瘤病例中融合和体细胞突变事件的分布。 激活样品 拉丝/布拉夫 突变以红色显示。 ( D )Ba/F3细胞表达的剂量依赖性生存分析 皇家空军一号 用曲美替尼治疗融合72小时。 ( E )终点体积( CLCN6-RAF1 (注射后第23天) CLCN6-RAF1 ( n =10)和GFP控制( n =10)。 ( F )曲美替尼对不同细胞系药物敏感性的比较 皇家空军一号 融合。 P 值基于威尔科克森检验。 药物数据:GDSC。 ( G )预注射HMEL细胞和肿瘤细胞裂解物的免疫印迹分析 CLCN6-RAF1。 ( H ) 吹牛 用曲美替尼处理融合72小时(细胞存活率的平均百分比,误差线表示SD, n =4(所有组)。 ( 我 )终点体积( 税号1BP1-BRAF (注射后第43天) 税号1BP1-BRAF ( n =10)和GFP控制( n =10)。 水平条表示平均体积; 误差线表示SD。 ( J )免疫印迹法分析预注射的HMEL细胞、肿瘤和肿瘤衍生细胞表达的裂解产物 税号1BP1-BRAF (A和E)全部 P 计算值依据 t 试验**** P trans data-src=" 10"<10岁? 4 .
为了研究这些融合的治疗效用,我们进行了剂量反应抑制剂试验,结果显示对MAPK激酶(MEK)抑制剂曲美替尼(IC)具有显著的敏感性 50 , CLCN6-RAF1 =1.223牛米 轨道1-RAF1 =0.9588 nM),在Ba/F3细胞中表达 皇家空军一号 熔合( 图5D)从融合后MAPK信号的强烈激活可以预测到( 图5B)接下来,我们利用原代人类黑素细胞(HMELs)来验证黑色素瘤衍生融合基因的转化活性( 26, 27),是评估黑色素瘤特异癌基因致瘤活性的理想方法。 原位注射HMEL细胞表达 CLCN6-RAF1 在无胸腺小鼠的真皮中发现了它强大的致癌活性(100%的肿瘤外显率, n =10; 图5E)与表达GFP的对照细胞相比( n =第0页,共10页)。 我们还观察到内源性 皇家空军一号 利用细胞系药物敏感性数据(Wilcoxon试验, P =0.026; 图5F),与 皇家空军一号 融合是肿瘤行为的驱动因素。 这也表明 皇家空军一号 融合可作为曲美替尼和其他可能的RAS/MAPK途径抑制剂的潜在益处的预测标记物。 为了支持这一论点 吹牛 trametinib(IC)融合致敏Ba/F3细胞 50 , 税号1BP1-BRAF =0.9107牛米, CDC27-BRAF公司 =0.6334牛米,以及 ATG7-BRAF公司 =1.148牛米; 亲本=45 nM; 图5H)我们观察到在注射稳定转染的HMEL细胞时也有类似的效果 吹牛 融合, 税号1BP1-BRAF 极大地促进了肿瘤的生长( 图5I)与对照组相比,注射了四种细胞的肿瘤没有形成( n =第0页,共10页)。 细胞和肿瘤裂解物的免疫印迹分析得到证实 CLCN6-RAF1 和 税号1BP1-BRAF MAPK信号转导与GFP表达HMEL细胞的比较( 图5,G和J).这些结果表明,尽管合作伙伴存在显著的差异, 皇家空军一号 和 吹牛 融合是黑色素瘤和其他肿瘤谱系中一类重要的可操作事件。
FGFR公司 熔合 成纤维细胞生长受体基因的癌基因重排 FGFR1型 FGFR2型 , FGFR3型 ,和 FGFR4型 以前有过报道( 28). FGFR公司 在TCGA队列中发现了20种癌症类型的基因融合,其中包括复发性融合 WHSC1L1-FGFR1 , FGFR2-BICC1 ,和 FGFR3-TACC3 ( 图6A).与以前的研究一致( 29– 31), FGFR2-BICC1 和 FGFR3-TACC3 在我们的Ba/F3活性测定中显示出显著的激活作用。 一个有趣的例子是 FGFR3-ELAVL3 在低级别胶质瘤中检测到融合,其中基因组断点位于 FGFR3型 自从融合记录 FGFR3-ELAVL3 希望保留的终止密码子 FGFR3型 ,这个转录本的翻译不能产生融合蛋白。 然而,通过选择性的mRNA剪接,最后一个外显子带有3′UTR FGFR3型 会被剪接出来,而之前的外显子 FGFR3型 因此融合到 ELAVL3号 ,生成帧内转录本( 图6B).以前的研究表明 FGFR3-TACC3 融合是通过失去microRNA对3′UTR的控制而起作用的 FGFR3型 ( 32); 同样,这里描述的融合将有助于减少 FGFR3型 通过肿瘤抑制基因microRNAs。
图6 .频率和功能效应 FGFR公司 融合。
( A )TCGA泛癌FGFR融合的总结。 ( B )基因组结构示意图和mRNA转录本 FGFR3-ELAVL3 . ( C )MCF10A锚地-独立菌落形成分析 FGFR3-ELAVL3 (10个随机区域的平均菌落计数,误差条表示SD, n =3)。 PIK3CA公司 H1047R型 =阳性对照,GFP=阴性对照。 ( D )免疫印迹 FGFR3-ELAVL3 MCF10A的表达及信号通路的激活。 全部 P 计算值依据 t 试验*** P trans data-src=" 0.005 and ****"<0.005和****P trans data-src=" 0.0001. "<0.0001。膀胱尿路上皮癌; 乳腺浸润癌; 宫颈鳞状细胞癌和宫颈腺癌; 胆管癌; 食管癌; GBM,多形性胶质母细胞瘤; 头颈部鳞状细胞癌; 肾乳头状细胞癌; 急性髓系白血病; LGG,脑低级别胶质瘤; 肝细胞癌; 肺腺癌; 肺鳞状细胞癌; 卵巢浆液性腺癌; 前列腺癌; 皮肤黑色素瘤; 胃腺癌; 甲状腺癌; 子宫内膜癌; 还有UVM,葡萄膜黑色素瘤。
我们评估了 FGFR3-ELAVL3 用菌落分析法在MCF10A细胞中融合。 我们发现 FGFR3-ELAVL3 导致菌落形成显著增加(12倍, P =5×10 ? 4 ; 图6C)与致癌物相似 PIK3CA公司 H1047R型 控制( 33)免疫印迹分析( 图6D)MCF10A细胞表达 FGFR3-ELAVL3 ERK1/2(T202/Y204)和S6(S235/236)的磷酸化水平升高,这与 FGFR3型 在激活MAPK通路中的已知作用( 34)并观察其他 FGFR3型 基因融合,如 FGFR3-TACC3 事件( 35)这在多种癌症中都存在。
一种基于证据的分类方法,为精确肿瘤学 确定可行的基因融合优先级 基于我们开发的功能基因组学方法和从上述分析中获得的见解,我们提出了一个完整的证据级别分类系统,系统地对基因融合进行优先排序,以传达单个融合事件的临床效用,该系统由四个级别组成( 图7A)具体来说,4级(L4):融合存在证据,通过肿瘤测序数据确定的基因融合; L3:基于相关性的证据,融合显示与整体药物敏感性显著相关,例如。, 皇家空军一号 融合到曲美替尼( 图5F); L2:功能证据,在体外和/或体内对肿瘤生长或药物反应有显著影响的融合,例如。, 税号1BP1-BRAF1 ( 图5、D和H); L1:临床证据,与患者数据中预测治疗反应的证据相融合,例如。, EML4-ALK公司 肺癌。 水平越低,基于肿瘤中鉴定出的特定基因融合治疗患者的证据就越有说服力。
图7 一个基于证据的分类系统,用于优先考虑可行的基因融合。
( A )精确肿瘤学中可操作基因融合的四级循证分类系统概述。 野生型。 ( B )根据TCGA患者队列中确定的融合,总结RTK-RAS途径中的融合分类。 L2融合只包括我们功能性评估的融合,L1融合包括有临床证据的融合,不一定在本研究中评估。*** 表示统计显著性。 ( C )临床环境下融合功能评估流程的时间表。
接下来,我们将上述分类应用于完整的TCGA患者队列,重点关注RTK-RAS通路,我们拥有最丰富的功能证据。 n =97),肾嫌色性肉瘤为0.9%( n =1); 237例中177例L3融合; 根据本研究中产生的功能证据,86例患者中有23例L2融合(例如,44例患者携带 FGFR公司 熔合); 129例患者中有5例L1融合( 图7B)这项分析阐明了我们的功能基因组学平台是如何使系统化的方法来识别潜在的临床可操作的融合事件。 为了提高临床效果,我们对流程中的每一步都进行了优化,以便从患者肿瘤的RNA测序数据中识别融合候选物到完成体外细胞活力和药物敏感性分析的整个过程可以在7周内完成( 图7C)此外,与我们的基因合成方法相比,这种方法可以大大降低基因合成的成本。
讨论 在这项研究中,我们开发了一种功能基因组学方法来测试融合基因的转化潜能和药物反应性,并展示了该方法的可扩展性,包括在临床相关时间尺度上进行分析的能力。 这里描述的基因融合为评估预测癌症驱动基因融合的计算算法提供了一套黄金标准。 我们发现相当一部分低频(甚至是单基因)基因融合具有功能效应和潜在的治疗相关性,这对患者管理具有重要意义。 尽管融合基因已经代表了几十年的治疗靶点(例如,靶向 BCR-ABL公司 慢性粒细胞白血病的治疗发生了显著改变),功能特征和治疗努力主要集中在高复发性融合候选。 我们的研究重申,迫切需要考虑将低频融合作为潜在的治疗目标,以实现个性化癌症治疗的全部前景。 由于我们的功能分析方法可以在相对较短的时间内(如7周)完成,我们建议该方法可应用于临床,以识别可能驱动肿瘤行为的功能融合基因,并预测对特定治疗方案的反应。
我们认识到我们的方法有一些局限性。 首先,我们主要用Ba/F3作为模型细胞系来评估基因融合的功能效应。 虽然大多数已知的功能性融合基因(例如。, FGFR3-TACC3 和 ETV6-NTRK3 )系统中可能有“F3/Ba不活跃”的“系统中的某些谱系可能不活跃”。 例如, KLK2-FGFR2型 在nih3t3模型中,前列腺腺癌和葡萄膜黑色素瘤被认为是一种潜在的致癌事件,并被报道改变细胞形态和促进迁移( 36)然而,我们使用第二个信息者细胞系MCF10A进行的平行评估表明,我们平台的假阴性率可能很低。 第二,我们主要使用细胞活性分析作为表型效应的读数,这并没有捕捉到致癌驱动因素的所有功能后果。 然而,在多个系统中,这种表型分析报告了患者对治疗的反应。 作为对活性检测的补充,我们还探索了其他功能检测,如克隆形成检测。 第三,我们的方法可能在敏感的Ba/F3信息体细胞系中发现一些融合阳性,在特定的谱系背景下可能有更温和的影响。 我们评估活化融合药物敏感性的策略应该可以减轻这种担忧。 总的来说,我们设计这种方法是为了在实验效率和表征的全面性之间提供一个很好的平衡,目的是能够为临床决策提供及时的支持。 需要进一步的努力来改进我们的方法来捕捉更多的“上下文相关”的表型效应。
我们提供了一个全面的观点,从基因融合的RTK-RAS途径跨越33种癌症类型。 我们的研究结果表明,除了基因的高频激活突变,如V600E 吹牛 和G12D英寸 克拉斯 ,基因融合也可以对RTK-RAS通路的激活起到较小的作用,但仍然是令人信服的。 总的来说,虽然大约每七个测序肿瘤中就有一个携带RTK-RAS通路成员的融合基因,但不同癌症类型的RTK-RAS通路中融合基因的频率存在显著差异。 这一观察结果与先前的研究一致,这些研究表明,在黑色素瘤等肿瘤中,RAS突变的激活占优势( 25),胰腺,食管( 37)膀胱癌( 38)此外,某些实体瘤似乎比其他实体瘤更容易融合,如甲状腺癌,尽管其结构“安静”,但其RTK-RAS融合基因的突变负担相当大( 39)同样,肉瘤似乎含有频繁的融合基因,这些基因很可能是肿瘤的驱动因素( 40)像黑色素瘤和胃腺癌这样的癌症类型通常含有超重组的基因组区域,其中包括RTK-RAS通路基因,这些基因有可能导致功能相关的融合基因。
虽然特异性基因融合个别罕见,但它们共同对RTK-RAS通路的激活做出了重大贡献。 有许多治疗方法可以抑制RTK-RAS通路成员,目前已有或正在研究中。 例如,我们的研究确定了两个驱动因素 遇见 熔合( BAIAP2L1-MET公司 和 TFG-MET公司 )至少有一个正在进行的针对MET融合阳性肿瘤的临床试验(NCT02978261)。 因此,即使没有FDA批准的药物,我们的功能基因组学方法确定的致癌融合可以被添加到有希望的治疗目标的可行列表中。 除了临床认可的复发性靶点,如 BCR-ABL公司 白血病和 阿尔克 和 ROS公司 肺癌融合,积累的数据支持临床对罕见畸变的反应。 例如,一个病例报告显示两个转移性黑色素瘤患者 吹牛 当用MEK抑制剂曲美替尼治疗时,两者的融合症状都有改善( 41).与靶向性罕见融合相关的积极临床结果支持了对治疗模式的考虑,根据这种融合的存在独立于组织或肿瘤来源来治疗患者。 功能性信息,如这里提供的信息,或通过治疗获得的关于特定融合的信息,将大大提高基于特定罕见融合基因治疗患者的信心。 因此,当前病人分层策略的一个不可或缺的因素是基因融合的功能特征,潜在的重点是药物靶点。 为了达到这个目标,我们的功能基因组方法和提出的四级循证分类系统代表了一个初步但关键的尝试,以改善针对罕见基因融合事件的临床影响。
材料和方法 老鼠 雌性裸鼠- 狐狸1 努 4~6周龄; 查尔斯河实验室]被用于异种移植瘤研究。 在饲养和居住条件下,所有老鼠都被随意喂食标准的杂粮,并被安置在一个无病原体的设施中,在兽医的监督下,每个笼子不超过5只老鼠,且温度、湿度和明暗循环(12小时)条件下, 在贝勒医学院国际实验动物护理评估与认证协会认证动物设施。 所有动物程序都经过贝勒医学院动物护理和使用委员会(AN-5428)的审查和批准。
细胞系 293T细胞[美国类型培养集(ATCC)]培养在杜尔贝科改良的Eagle培养基(Thermo Fisher Scientific)中,并添加10%胎牛血清(FBS;Thermo Fisher Scientific)。 亲代Ba/F3细胞在RPMI 1640培养基(Thermo Fisher Scientific)中培养,添加5%FBS(Thermo Fisher Scientific)和重组小鼠IL-3(2.5 ng/ml;研发系统)。 MCF10A细胞(ATCC)如前所述进行培养( 42).HMEL细胞( 26)在添加10%FBS、青霉素(100u/ml)和链霉素(100μg/ml)的RPMI 1640培养基中培养。 所有细胞系在37℃和5%CO条件下培养 2 空气加湿。 在MD-Anderson癌症中心使用短串联重复序列(STR)测试平台对细胞系核心设施进行了鉴定。
基因融合选择 为了平衡发现能力和评估偏差,我们从TCGA患者中选择100个融合基因,基于两个因素,融合伙伴基因的潜在药物性和RTK-RAS通路的参与。 在伴侣基因的药物性注释方面,我们设定TClin为50%,tcem为35%,TBio为15%; 对于TClin,我们进一步将RTK/RAS设置为80%; 对于TCEM,我们将RTK/RAS设置为20%。 然后,基于这些预先确定的估计,我们从每个类别中选择相应数量的融合候选。 此外,我们还包括了在MD-Anderson患者样本中检测到的一些基因融合。 共筛选出110个基因融合。
基因融合构建 如前所述,融合基因构建物是使用网关多片段重组技术生成的( 12)简单地说,融合基因的构建是基于PCR,使用与ORFeome合作获得的每个融合基因片段相对应的序列验证开放阅读框(ORF)( www.orfeomecollaboration网站。组织),哺乳动物基因收集,和商业化的ORF来源(最终的ORF克隆;生命技术)作为PCR模板。 分别用PCR扩增出左(门)臂和所需的基因片段。 通过BP重组(Life Technologies),将左右臂PCR产物分别整合到pDONR载体(Life Technologies)和pFUSE-B载体(Addgene,质粒号97185), 然后按照制造商的建议,通过LR重组反应(Life Technologies)将多片段重组到pFUSE-DEST_R1R4载体(Addgene,质粒号97186)。 反应混合物在室温下培养过夜,随后转化为STBL3(生命技术)活性细菌。
Ba/F3细胞活力测定 慢病毒的产生和转导Ba/F3细胞在Ng 等 . ( 17)简单地说,用含有融合基因的载体和包装质粒(psPAX2和pMD2.G)转染Lenti-x293t细胞。 转染后3天取慢病毒,于1000时用棘球法转染Ba/F3细胞 g 在聚布伦(最终浓度为8μg/ml)存在下持续3小时。 对于Ba/F3转化潜能测定,如前所述,将转化的Ba/F3细胞在不含IL-3的培养基中培养7天( 15, 16)用细胞滴度Glo(Promega)测定细胞活力。 在抑制剂检测中,稳定表达融合的Ba/F3细胞(在无IL-3培养基中)和亲本Ba/F3(在常规培养基中)以4份种子接种在96孔板中,每孔1000个细胞。 用不同浓度的二甲基亚砜或相应的抑制剂处理细胞72小时,用细胞滴度Glo(Promega)测定细胞活力。 至少进行了两个独立的实验。 所有抑制剂化合物均购自Selleck Chemicals。
MCF10A安克雷奇-独立生长分析 通过慢病毒感染将融合基因导入MCF10A细胞。 如前所述( 12)软琼脂试验在6孔板中进行,一式三份。 首先,用0.8%贵琼脂(Affymetrix公司)和完整的MCF10A培养基制备底层。 凝固后,将10000个细胞与0.45%琼脂混合,置于最底层。 3天后每孔加入2毫升培养基,每3天更新培养基。 接种2周后计数菌落数。
免疫印迹法 细胞和肿瘤组织用含有蛋白酶抑制剂鸡尾酒(Sigma-Aldrich)和磷酸酶抑制剂鸡尾酒(Calbiochem)的放射免疫沉淀试验缓冲液进行裂解。 蛋白质裂解物在4~12%双三硅凝胶(Novex)上分离,转移到聚偏二氟乙烯膜上。 以下抗体用于检测表达:Raf1(Abcam)、BRAF(B-Raf原癌基因、丝氨酸/苏氨酸激酶)(Santa Cruz Biotechnology)、磷酸化Erk1/2(T202/Y204)(细胞信号技术)、Erk1/2(细胞信号技术)和甘油醛-3-磷酸脱氢酶(Santa Cruz Biotechnology)。
体内异种移植瘤检测 所有使用小鼠的研究都是按照贝勒医学院动物护理和使用委员会批准的动物方案(AN-5428)进行的。 将100万个细胞重新悬浮在1:1的Hanks's平衡盐溶液(Life Technologies)和Matrigel(BD Biosciences)中,并将其注射到雌性变态小鼠双侧腹皮下或直接注射到真皮中( 27)每周监测2次,测量肿瘤体积,以长×宽计算体积 2 /2。
TCGA基因融合的生物信息学分析 6, 8)从TCGA肿瘤标本中鉴定出RTK-RAS途径基因的体细胞突变来自TCGA泛癌分析( 19)中心度评分来自肿瘤应用数据库( 8)在TCGA-Pan-Cancer分析确定的RTK-RAS通路的基础上,获得RTK-RAS通路的相关基因并进行融合( 19)以及RAS倡议( 20).利用Cytoscape构建融合癌二部网络( www.cytoscape。组织)基于TCGA患者队列中确定的融合频率。
药物敏感性分析 阿尔克 和 皇家空军一号 基因融合 药敏数据来源于肿瘤药物敏感性基因组学(GDSC)( www.cancerrxgene。组织)癌症治疗反应门户网站(CTRP)v2( https://portals.broadinstitute.org/ctrp/)细胞系样本中的基因融合和相应的基因表达数据来源于肿瘤细胞系百科全书( https://portals.broadinstitute.org/ccle).有无细胞系药物敏感性(曲线下面积)的差异分析 阿尔克 或 皇家空军一号 融合采用Wilcoxon试验。 之间的联系 阿尔克 或 皇家空军一号 基因表达和ALK或RAF抑制剂通过Pearson相关试验进行评估。
基于证据的基因融合优先排序系统 使用TCGA数据,我们应用了中定义的分类系统 图7A优先考虑与RTK-RAS通路有关的L4-L2可操作基因融合。 从TCGA基因融合列表中筛选出在RTK-RAS途径中至少有一个伴侣基因的L4融合。 对每个癌组织中存在RTK-RAS融合的患者数量进行计数,以生成绿色条形图 图7B为了说明L3融合,我们利用从GDSC和CTRPv2获得的药物敏感性数据对每对RTK-RAS基因及其相应的抑制剂进行了药物敏感性差异分析。 trans data-src="The significant genes were selected under a false discovery rate of 0.2. "在错误发现率<0.2的情况下选择有意义的基因。在热图中进一步统计和总结了携带这些重要基因的融合患者。 我们的功能平台注释的激活融合被注释为L2融合。 我们进一步从TCGA患者队列中识别出L2融合的患者,并在条形图中按每个基因家族分组(例如。, FGFR公司 和 NTRK公司 ).
数据门户开发 CouchDB以及第一个加载到功能性元数据中的CouchDB。 融合基因频率是从两个先前的研究中获得的( 6, 8)文献资料采用人工整理。 融合图是在生成棒棒糖图的命令行工具的基础上开发的。 柱状图是由Highcharts生成的。 交互表由DataTables生成。
量化与统计分析 使用R(版本3.6.1)进行统计分析。 为了评估两个连续变量之间的相关性,采用Pearson相关检验; 为了评估两个分类变量之间的相关性,采用卡方检验; 比较两组的平均值,威尔科克森和学生的平均值 t 使用了测试。 统计试验的详细说明见材料和方法以及相应的图形图例。