《Human Genomics》:Genetics and clinical implications of SPINK1 in the pancreatitis continuum and pancreatic cancer
SPINK1 概述:蛋白质发现、功能、基因结构及疾病关联
丝氨酸蛋白酶抑制剂 Kazal 型 1(SPINK1)编码胰腺分泌型胰蛋白酶抑制剂,是最早在生物化学和功能上得到深入研究的酶之一。胰蛋白酶作为蛋白质消化的关键酶,在胰腺中以无活性的前体形式即胰蛋白酶原存在。胰蛋白酶原在粗面内质网和高尔基体中加工后成为胰蛋白酶原,随后储存于分泌颗粒中,释放到胰管,在十二指肠中被肠肽酶激活,进而触发其他消化酶的激活。
然而,胰蛋白酶原在胰腺内过早激活会引发胰腺自身消化,带来严重威胁。为降低这一风险,胰腺腺泡细胞会合成包括 SPINK1 在内的胰蛋白酶抑制剂。在健康个体中,SPINK1 能够抑制高达 13% 的胰蛋白酶活性,这充分凸显了它在防止胰腺内胰蛋白酶过早激活方面的关键保护作用。
1985 年,研究人员首次从人类胰腺 cDNA 文库中鉴定出 SPINK1 的 mRNA 序列,1987 年其基因组序列结构得以揭示。1996 年,研究发现编码阳离子胰蛋白酶原的 PRSS1 基因上的功能获得性错义突变(p.Arg122His)是常染色体显性遗传性胰腺炎的病因。四年后,Witt 及其同事通过分析德国一组不相关的儿童和青少年患者,报道了 SPINK1 变异与慢性胰腺炎(CP)之间的关联,此后这一发现得到了众多研究的证实。
胰腺炎相关的 SPINK1 变异
胰腺炎相关的 SPINK1 变异类型多样,数量繁多,涵盖了经典剪接位点变异、大片段基因缺失、小的插入或缺失变异,以及经实验分析的调控变异和错义变异等,这些变异均会导致功能丧失。在此,重点介绍三种具有明确致病机制且引人关注的 SPINK1 变异。
c.-4141G>T:与 p.Asn34Ser 处于连锁不平衡的致病变异
p.Asn34Ser(c.101A>G)变异是与 CP 关联研究最为广泛的变异之一,这主要归因于其在欧洲人群中的高等位基因频率,例如在 gnomAD 非芬兰欧洲人群中为 0.01151,且其效应显著。多项荟萃分析和德国的一项代表性研究均一致表明,携带该变异的个体患 CP 的优势比(OR)约为 10。
然而,确定这一关联背后的真正致病变异却历经了漫长而复杂的过程。研究已排除 p.Asn34Ser 作为错义突变导致功能丧失的可能性,并且小基因和全长基因剪接试验均显示,c.101A>G 及其相关变异对 mRNA 剪接或稳定性并无显著影响。
通过 HaploReg v4.1 查询 1000 Genomes Project Phase 1 中欧洲人群的数据,研究人员发现有 25 个单核苷酸多态性与 c.101A>G 处于强连锁不平衡状态(LD)。其中,只有 rs142703147:C>A(c.-4141G>T)位于进化上保守且染色质可及性高的区域,预测其会破坏一个假定的 HNF1A-PTF1L 顺式调控模块。HNF1A 和 PTF1L 是调节外分泌胰腺功能和腺泡细胞稳态的转录网络的重要组成部分。
功能研究,包括共转染反式激活实验,表明 c.-4141G>T 会降低 SPINK1 基因的表达。在两个携带 SPINK1 p.Asn34Ser 单倍型的胰腺癌细胞系中,也观察到变异等位基因的表达降低。对三个携带 p.Asn34Ser 杂合子个体的 RNA 转录本分析同样显示,与野生型(WT)等位基因相比,变异等位基因的转录本读数显著减少。c.-4141G>T 被确定为真正的致病变异意义重大,它为个性化治疗方法提供了潜在靶点。
c.194+2T>C:保留部分野生型转录本产生的经典 5' 剪接位点 GT>GC 变异
通常认为,改变经典剪接位点(供体 + 1 和 + 2 位点、受体 - 1 和 - 2 位点)的变异会导致野生型转录本完全缺失。然而,越来越多的经典 5' 剪接位点 + 2T>C(GT>GC)变异对这一假设提出了挑战,因为它们仍能产生一些野生型转录本。
SPINK1 c.194+2T>C 变异位于内含子 3,就是这样一个典型例子。该变异纯合子产生的正常剪接转录本约为正常受试者的 10%,这一显著但不完全的剪接效应通过全长基因剪接试验(FLGSA)得到了证实。
在 gnomAD 数据库中,导致完全功能丧失的 SPINK1 变异极为罕见或不存在(等位基因频率低于 0.0001),这反映出强大的选择压力。相比之下,c.194+2T>C 在 gnomAD 东亚人群中的等位基因频率较高(0.002192),表明其选择压力较小。这也解释了为何在一个大型中国特发性 CP(ICP)队列中,该变异在杂合子和纯合子状态下均频繁被检测到。
在这个队列中,c.194+2T>C 杂合子和纯合子(且 PRSS1、CFTR 和 CTRC 基因均无致病变异)患 CP 的 OR 值分别为 30.4 和 162.4。而且,纯合子患者的疾病发病年龄和胰腺结石形成年龄显著早于杂合子患者,杂合子患者又显著早于 PRSS1、SPINK1、CFTR 和 CTRC 基因无致病基因型的 ICP 患者。
对携带 c.194+2T>C 变异的小鼠研究发现,纯合子小鼠出生后不久死亡,约 30% 的杂合子小鼠在 14 周龄时会发生胰腺炎。有趣的是,SPINK1 c.194+2T>C 变异还与中国女性 CP 患者的不良妊娠结局相关,但这种关联是由变异对妊娠结局的直接影响,还是 CP 的间接影响所致,目前尚不清楚。
此外,研究还发现,虽然 SPINK1 变异相关的不良妊娠结局仅见于女性,但男性和女性在胰腺解剖、大小和功能上的差异,可能暗示着 CP 遗传病因中存在其他性别相关差异。不过,关于 CP 队列中用于遗传分析的男女比例,文献中的观察结果并不一致。
最后需要强调的是,SPINK1 c.194+2T>C 变异的相关研究成果促使人们进一步探究类似能够产生野生型转录本的变异的普遍性。数据表明,人类基因中所有潜在的 + 2T>C 变异中,约 15 - 18% 能够产生 1% - 84% 的正常转录本。这一发现对疾病诊断和变异解释至关重要,意味着 + 2T>C 变异并不总是致病的,也能够解释疾病表现出乎意料地轻微的现象。但目前,利用现有的计算机工具预测 + 2T>C 变异是否会产生野生型转录本仍然具有挑战性。
Alu 插入 SPINK1 的 3'-UTR:一种导致完全功能丧失的新机制
Alu 元件长度约为 300 个碱基对,约占人类基因组的 11%,在基因组中广泛分布,拷贝数超过 100 万。由 LINE - 1 介导的 Alu 插入与多种人类疾病相关。
在一名患有严重婴儿期孤立性外分泌胰腺功能不全(SIIEPI)的个体中,发现了 SPINK1 的 3'- 非翻译区(3'-UTR)存在一种罕见的 Alu 插入。这种纯合突变被证实会完全消除 SPINK1 的表达,通过基于细胞培养的全长基因表达试验和对受影响个体淋巴细胞的 RT - PCR 分析均验证了这一点。同样,另一名 SIIEPI 患者被发现 SPINK1 基因完全纯合缺失。这两名患者从婴儿早期就表现出严重的外分泌胰腺功能不全,并发展为弥漫性胰腺脂肪沉积,但其他器官功能未受明显影响,这些症状与纯合 Spink1 基因敲除小鼠中观察到的胰腺腺泡细胞坏死相似,后者通常会导致围产期死亡。
最近研究发现,Alu 插入的有害影响源于其与 SPINK1 内含子 3 中已有的 Alu 元件形成延伸的双链 RNA 结构,这揭示了一种此前未知的致病机制。关键证据包括内含子中两个已有的 Alu 序列与插入的 Alu 方向相反,并且当所有三个 Alu 元件方向一致时,SPINK1 mRNA 的表达得以恢复。鉴于新的 Alu 插入几乎可能发生在基因组的任何位置,且 Alu 元件在人类基因组中广泛分布,这些发现对变异检测和解释具有重要意义。
SPINK1:首个前瞻性确定所有可能编码变异剪接影响的基因
以往被认为是中性的变异,如错义突变或沉默突变,可能会通过影响剪接导致疾病发生。在精准医学领域,如果忽视剪接改变,针对特定变异的个性化治疗可能会失败。因此,准确地以前瞻性的方式确定编码变异对剪接的影响至关重要。
与一些近期研究中使用小基因试验评估剪接影响的常见做法不同,研究团队常规使用 FLGSA 来表征 SPINK1 变异的剪接效应。在 FLGSA 系统中,以 pcDNA3.1/V5 - His TOPO 载体为骨架,插入约 7kb 的 SPINK1 基因组序列,包括所有外显子和内含子,这种方法保留了基因的天然基因组背景,对于复杂的剪接调控至关重要。研究团队利用已知的 SPINK1 变异对 FLGSA 试验的准确性和可靠性进行了验证。
借助 FLGSA 试验和用于剪接预测的深度神经网络工具 SpliceAI,研究团队成功前瞻性地解释了 SPINK1 内所有潜在编码单核苷酸变异(SNVs)的剪接效应。他们首先对 27 个先前经 FLGSA 评估的 SPINK1 编码 SNVs 进行回顾性分析,随后对 35 个新的 SNVs 进行前瞻性分析,总共检测了 67 个 SPINK1 编码 SNVs,占 720 个可能编码 SNVs 的 9.3%。
在分析的 67 个 SNVs 中,有 12 个被发现会影响剪接。通过比较 FLGSA 结果和 SpliceAI 预测,研究团队推断 SPINK1 中其余 653 个未测试的编码 SNVs 不太可能显著影响剪接,因此得出结论,SPINK1 中潜在编码 SNVs 中可能影响剪接的比例不到 2%。
SPINK1 变异与胰腺炎的 SAPE 模型
胰腺炎危险因素的遗传学研究通常从 CP 的研究入手。如今,人们普遍认识到急性胰腺炎(AP)、复发性急性胰腺炎(RAP)和 CP 之间存在疾病连续体关系。为解释这一进展过程,哨兵急性胰腺炎事件(SAPE)模型应运而生。该模型认为,首次 AP 发作作为一个哨兵事件,会使胰腺敏感化,使其更容易发生 RAP。RAP 反复带来的应激和炎症最终可能导致 CP。
支持 SAPE 模型的小鼠研究
近期的小鼠模型研究为 SAPE 模型提供了直接支持。在一项研究中,通过 cerulein 诱导的 AP 小鼠模型发现,首次 AP 发作会加剧后续发作的严重程度,持续的巨噬细胞浸润被确定为在后续发作中导致损伤加剧和炎症反应更严重的关键机制。
在另一项研究中,对野生型和 Spink1 c.194+2T>C 突变小鼠通过 cerulein 注射诱导 SAPE 发作。结果显示,Spink1 c.194+2T>C 突变小鼠在 SAPE 发作后 24 小时内表现出更严重的 AP 表型,在慢性期也发展出比野生型小鼠明显更严重的 CP 表型。蛋白质组学分析发现突变小鼠中 IL - 33 水平升高,后续体外实验表明 IL - 33 促进了 M2 巨噬细胞极化和胰腺星状细胞激活。
这两项研究分别从不同角度提供了支持:第一项研究提供了支持 SAPE 模型的一般概念验证证据,第二项研究则提供了遗传学概念验证证据,将 Spink1 c.194+2T>C 突变与 SAPE 驱动的胰腺炎进展联系起来。
p.Asn34Ser:连接 AP 与 CP
第一项确定 SPINK1 变异与 AP 之间显著联系的研究分析了 371 名 AP 患者和 459 名对照者,发现 AP 患者中 p.Asn34Ser 变异的患病率(7.8%)显著高于对照组(2.6%)。一项涵盖九项研究、共 1493 例病例和 2595 名对照者的荟萃分析显示,p.Asn34Ser 变异与 AP 风险增加显著相关(OR 2.87,95% 置信区间 1.89 - 4.34;P<0.001)。此外,p.Asn34Ser 在中重度 AP 病例中的出现频率高于轻度病例,表明它使个体更易患更严重的疾病进展(OR 2.05,95% 置信区间 0.85 - 5.1;P<0.005)。
后续研究表明,SPINK1 p.Asn34Ser 变异与 RAP 相关,而非首次 AP 发作。不过,携带该变异的个体在经历首次 AP 发作后,发展为 RAP 的可能性约为其他人的 19 倍。对患有 RAP 的儿童进行 25.5 个月的长期随访发现,p.Asn34Ser 的存在与进展为 CP 显著相关(P = 0.01)。
三项荟萃分析一致表明,p.Asn34Ser 单倍型与 CP 风险的 OR 值约为 10,而其与 AP 的 OR 值为 2.87。这种 OR 值的差异可能反映了该变异在加速 AP 向 CP 进展中的作用,这与 SAPE 模型及 Spink1 c.194+2T>C 小鼠研究的证据相符。与 p.Asn34Ser 不同,其他 SPINK1 变异没有如此广泛的与 AP 和 CP 相关的关联数据。
SPINK1 变异与 PDAC
胰腺导管腺癌(PDAC)约占所有胰腺癌病例的 95%,其五年生存率仅为 8%,是最致命的癌症之一,预计到 2030 年将成为癌症相关死亡的第二大原因。
CP 是 PDAC 的主要危险因素,一项对 12 项研究的荟萃分析显示,CP 患者患 PDAC 的标准化发病率比为 22.61(95% 置信区间 14.42 - 35.44)。鉴于 SPINK1 在调节 CP 风险中的关键作用,探究与 CP 相关的 SPINK1 变异是否也会增加 PDAC 风险具有重要意义。然而,早期的病例对照研究结果往往并不明确。例如,一项对六项病例对照研究(涉及 929 例胰腺癌病例和 1890 名健康对照者)的荟萃分析发现,两组之间没有显著差异(OR 1.52,95% 置信区间 0.67 - 3.45;P = 0.315),这主要归因于样本量较小,以及胰腺癌的多因素性质和只有约 5% 的 CP 患者在 20 年内会发展为胰腺癌的事实。
近期对来自南京队列的 1009 名中国 PDAC 患者的分析提供了有力证据,发现 21 例患者携带 c.194+2T>C 变异杂合子。与来自 ExAC 队列的 4327 名东亚对照者相比,OR 值为 3.2(95% 置信区间 1.8 - 5.7;P<0.001)。但如果使用 Zou 等人研究中的 1196 名中国对照者作为对照,差异则无统计学意义(1009 例病例中有 21 例杂合子,1196 名对照者中有 13 例杂合子;OR 1.93;95% 置信区间 0.96 - 3.88;P = 0.059),这凸显了大样本量在获得统计学显著性方面的重要性。
另外两项研究从不同角度进行了进一步探索。一项大型多中心欧洲队列研究比较了 209 名 SPINK1 相关胰腺炎患者和 302 名特发性胰腺炎患者,虽然两组 PDAC 的发病率没有显著差异,但前者患 PDAC 的风险是后者的 12 倍。另一项前瞻性观察研究对 965 名中国 CP 患者进行了 11 年的随访,发现携带 SPINK1 变异的患者患胰腺癌的风险低于未携带者,但差异接近统计学显著性(Cox 风险比 0.39,95% 置信区间 0.14 - 1.04;P = 0.059)。这些有争议的结果凸显了解释此类数据的复杂性,尤其是考虑到 CP 作为 PDAC 风险因素的既定作用,且与 CP 的潜在病因无关。
为有效评估 SPINK1 变异与 PDAC 之间的关系,在患者选择中纳入机制视角是合理的。病例对照研究理想情况下应比较先前诊断为 CP 的 PDAC 个体与健康对照者中 SPINK1 变异的频率。对上述两项研究数据的重新分析支持了这一方法:在欧洲队列中,70%(7/10)的 PDAC 个体携带 p.Asn34Ser 突变或 SPINK1 大片段缺失的杂合子;在中国队列中,17%(4/24)的胰腺癌患者携带 c.194+2T>C 变异,这些频率显著高于相应正常人群,进一步证实了 SPINK1 功能丧失(LoF)变异与 PDAC 风险增加之间的联系。这种风险增加可能源于变异诱导的 CP,它创造了一个促炎、致瘤的微环境,促进了癌症的发生和发展<
打赏
下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究
10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!
欢迎下载Twist《不断变化的CRISPR筛选格局》电子书
单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析
下载《细胞内蛋白质互作分析方法电子书》