《npj Precision Oncology》:Deciphering IGH rearrangement complexity and detection strategies in acute lymphoblastic leukaemia
编辑推荐:
这篇综述聚焦急性淋巴细胞白血病(ALL),详细阐述了免疫球蛋白重链基因(IGH)融合的机制、在 ALL 发病中的关键作用,以及当前的检测技术。研究指出 IGH 融合具有独特的形成机制,对疾病的进展、治疗和预后意义重大,为精准治疗提供了方向。
急性淋巴细胞白血病概述
急性淋巴细胞白血病(Acute Lymphoblastic Leukaemia,ALL)是一种血液系统恶性肿瘤,其特征为骨髓内未成熟淋巴细胞不受控制地增殖。ALL 具有高度异质性,根据已知的驱动癌基因和分子病变可分为多种亚型。
ALL 的发病机制涉及一系列基因组改变,包括整个染色体的缺失或重复、拷贝数变异(Copy Number Variations,CNVs)、单核苷酸变异(Single Nucleotide Variations,SNVs)、基因融合以及插入和缺失(Insertions and Deletions,INDELs)等。这些基因改变与淋巴细胞分化、细胞存活和增殖、细胞周期调控、转录调控等过程相关,特定的改变可提示预后不良和高复发风险,因此了解其分子景观对制定个性化治疗策略至关重要。
目前,ALL 的个性化风险适应性治疗基于临床表现(如年龄、白细胞计数)、通过核型 / 荧光原位杂交(Fluorescence In Situ Hybridization,FISH)鉴定的主要遗传亚型(如 ETV6::RUNX1、高 / 低二倍体、BCR::ABL1)以及微小残留病(Minimal Residual Disease,MRD)水平。例如,酪氨酸激酶抑制剂(Tyrosine Kinase Inhibitors,TKIs)用于治疗费城染色体阳性(Ph + )ALL,就是利用了 BCR::ABL1 融合导致的组成型活性酪氨酸激酶。然而,部分基因改变难以通过传统分子技术检测,高通量分子技术虽有所帮助,但因其稀有性和多样性仍面临挑战。
免疫球蛋白重链基因(IGH)环境
免疫球蛋白(Immunoglobulin,IG)基因座位于染色体 14q 的亚端粒区域,在产生多样化抗体方面发挥关键作用。抗体由浆细胞产生,具有相似的整体结构,C 末端为恒定区,N 末端为可变区。
IG 基因座分为轻链 κ、λ 和重链基因座。免疫球蛋白重链(IGH)基因座包含可变(Variable,V)、多样性(Diversity,D)和连接(Joining,J)基因片段,以及恒定(Constant,C)区。在 B 细胞发育过程中,V、D、J 基因片段发生体细胞重组,形成功能性 V (D) J 单位,与 C 区一起表达。在此过程中,末端脱氧核苷酸转移酶(Terminal Deoxynucleotidyl Transferase,TdT)随机添加 N - 核苷酸,增加了接头多样性,使人类免疫系统能产生大量独特抗体。
此外,IGH 可变区(IGHV)具有高度重复性,这使得检测 IGH 重排面临挑战。例如,Matsuda 等人发现 13 个重复的 IGHV 基因片段,其中约 10Kb 的片段在 IGH 组装序列中出现 11 次,这种高度变异性和重复性增加了检测的难度。
IGH 基因融合
IGH 基因融合与传统基因融合机制不同。传统基因融合通常由染色体重排或易位导致,使两个不同基因并列,产生驱动肿瘤发生的融合蛋白,如 BCR::ABL1 融合。
而 IGH 融合源于 V (D) J 重组过程的异常,正常情况下 V (D) J 重组是产生适应性免疫反应多样性的关键,但有时会出现异常,使不同染色体位点的遗传物质插入到 IGH 增强子附近,这种 “增强子劫持” 机制导致伙伴基因过表达,进而促进细胞不受控制地生长和存活,成为致癌驱动因素。
IGH 融合的一个特征是融合接头处存在非模板核苷酸,这是 TdT 在 V (D) J 重组过程中添加的,增加了检测和表征的难度。在其他基因融合事件中,非模板核苷酸通常位于内含子区域,转录时会被剪接去除,但 IGH 融合中这些核苷酸可能保留。
IGH 融合在多种淋巴瘤和浆细胞肿瘤中常见,在 ALL 中情况更为复杂。ALL 中 IGH 融合涉及多种伙伴基因,常与其他基因组改变同时发生,共同促进白血病发生。例如,IGH::CEBPE 融合常与肿瘤抑制基因 CDKN2A 和 CDKN2B 的缺失同时出现;IGH::CRLF2 与 ALL 的高危 Ph 样亚型相关,其过表达导致下游 JAK/STAT 信号通路持续激活,促进白血病发生,且与 IKZF1 缺失或 JAK2 突变同时出现时预后更差;IGH::DUX4 常见于 DUX4r ALL,一般预后良好,但与 IKZF1 缺失同时出现时会导致化疗耐药和复发。
IGH 融合检测方法
检测 IGH 重排及其伙伴基因面临诸多挑战。逆转录聚合酶链反应(Reverse - Transcription - Polymerase Chain Reaction,RT - PCR)是一种常用且成本效益高的方法,可检测已知伙伴基因的重排,具有敏感性高、结果快速等优点,还可通过 qRT - PCR 进行定量分析监测疾病进展。然而,它只能检测已知伙伴的融合事件,无法识别新的或意外的融合,易出现假阴性和假阳性,且无法提供重排的详细结构信息。
荧光原位杂交(FISH)可直接观察染色体重排,能识别已知和未知的融合伙伴,但设计探针需要先了解潜在的基因伙伴。对于 IGH 易位,使用 IGH “断裂” 探针组在间期 FISH 实验中可简化检测,出现易位时会产生 “分裂” 信号。但 FISH 仅能提供结构信息,无法精确确定断点,分辨率有限,且操作繁琐、耗时,依赖专业技术,无法提供转录水平信息。
RNA 测序(RNA - seq)可全面分析转录组,能识别新的融合转录本和未知融合伙伴,检测可变剪接事件,提供基因表达水平信息,有助于 ALL 的亚型分类。但 RNA - seq 对 RNA 质量要求高,实验设计和生物信息学分析需谨慎,且作为批量测序方法,难以区分正常和致病细胞的融合事件和基因表达谱,细胞分选可改善但仍受样本质量影响。
全基因组测序(Whole Genome Sequencing,WGS)能全面检测 IGH 基因融合,不依赖转录活性,可捕获 RNA - seq 可能遗漏的隐性易位和非规范断点,还能识别同时发生的基因组改变。不过,WGS 资源消耗大,成本高、周转时间长、计算需求大,数据解读复杂,需要强大的生物信息学流程。
使用 WGS 或 RNA - seq 检测 IGH 基因融合时,非模板核苷酸的插入会影响融合检测,导致嵌合读数比对不佳,降低检测的敏感性和特异性。开发专门的比对策略和融合检测算法对提高检测准确性至关重要。
技术和分析发展
长读长测序逐渐成为检测 ALL 患者 IGH 融合的有力工具。与传统短读长方法相比,它能生成跨越复杂基因组区域和结构变异的连续读数,更精确地识别 IGH 融合及其断点,减少基因组重复或 GC 丰富区域的歧义,提高诊断准确性。但目前长读长测序成本高、处理时间长、错误率高,计算需求大,生物信息学流程仍在发展中。
从批量 RNA - seq 到单细胞 RNA - seq(Single - Cell RNA - seq,scRNA - seq)是检测基因融合事件的重要进展。批量 RNA - seq 提供细胞群体的平均基因表达信息,可能掩盖罕见但临床重要的融合事件。scRNA - seq 在单细胞水平分析基因表达,可揭示白血病细胞群体的复杂性,识别携带特定基因融合的亚群,即使融合事件存在于少数细胞中也能检测到,有助于了解 ALL 的克隆结构和确定治疗靶点。此外,scRNA - seq 还能洞察肿瘤微环境中的转录异质性,多组学方法可进一步阐明融合事件的调控机制。然而,scRNA - seq 测序深度低、噪声大,检测低丰度融合转录本困难,成本高、实验复杂,数据分析和解读挑战大。
结论
IGH 基因融合是 ALL 中一类复杂的基因组改变,对疾病的发生、发展、预后和治疗具有重要意义。其独特的形成机制以及伙伴基因的多样性给检测带来了持续挑战。传统检测方法在检测常见 IGH 融合方面有一定作用,但在面对罕见或隐性重排时存在局限性。WGS 和 RNA - seq 虽拓宽了检测范围,但仍受技术限制。
长读长测序和 scRNA - seq 为检测 IGH 基因融合提供了新途径。长读长测序可全面表征结构变异,scRNA - seq 能捕获批量方法可能遗漏的罕见融合事件。随着技术的不断改进,结合先进的生物信息学工具,提高测序深度和准确性,有望实现更精准的诊断。
未来,进一步优化测序方法,采用多组学方法,将有助于更全面地理解 IGH 介导的白血病发生的调控机制,实现更精确的风险分层和个性化治疗,最终改善 ALL 患者的预后。