编辑推荐:
为解决现有乳腺癌分类方法难以精准识别 HER2-low 亚型等问题,研究人员开展基于 RNA-seq 和机器学习算法的乳腺癌亚型分类研究,开发出 BCC 分类器。该研究成果有助于推进乳腺癌精准治疗,强烈推荐科研读者阅读。
乳腺癌分类新突破:BCC 助力精准医疗
在医学领域,乳腺癌一直是人们关注的焦点。随着研究的不断深入,乳腺癌的分子分类取得了显著进展。曾经,PAM50 分类器的出现,就像在黑暗中点亮了一盏明灯,让人们看到了乳腺癌分子分类的新方向。它通过对基因表达进行层次聚类,成功地将乳腺癌分为 Luminal A(管腔 A 型)、Luminal B(管腔 B 型)、HER2-enriched(HER2 富集型)、Basal(基底型)和 Normal-like(正常样型)五种亚型 。这一分类方法在不同患者群体中展现出了预后意义,为后续的风险分层和临床治疗提供了重要依据,相关的 Prosigna 测试也应运而生,帮助医生更好地管理患者并识别具有复发倾向的内在亚型。
然而,就像再明亮的灯光也会有照不到的角落一样,现有的乳腺癌分子分类方法存在不少问题。不同亚型之间的一致性较低,Luminal 和 Normal-like 亚型的界限模糊不清,HER2-enriched 和 Basal 亚型内部又存在着显著的异质性。这些问题在 HER2-low 乳腺癌的识别上表现得尤为突出。HER2-low 乳腺癌是一种特殊的亚型,通过免疫组化(IHC)染色,其 HER2 表达为 1 + 或 2 + 且无扩增 。以往的研究发现,这个亚型的分子特征和预后分析存在诸多不确定性,缺乏明确的预后和生物学关联。但新兴的临床研究却带来了惊喜,新型 HER2 导向的抗体药物偶联物(ADCs)在晚期 HER2-low 乳腺癌治疗中展现出显著的临床益处,这不仅挑战了传统的 HER2 状态二分法分类,也表明准确识别和分类 HER2-low 乳腺癌至关重要。
为了解决这些问题,推动乳腺癌分类的进一步发展,研究人员踏上了探索之路。作者[第一作者单位] 的研究人员在《Nature Communications》期刊上发表了题为 “RNA-seq–based machine learning classifier improves breast cancer subtyping and defines the HER2-low subtype” 的论文。他们经过深入研究,开发出了一种名为乳腺癌分类器(Breast Cancer Classifier,BCC)的独特转录组分类器,为乳腺癌的精准分类带来了新的希望。研究表明,BCC 能够更精确地对乳腺癌进行亚型分类,重新定义了 PAM50 Normal 亚型,揭示了 HER2-low 和 Basal 亚型在预后特征上的相似性,这一成果在乳腺癌的临床治疗和研究中具有重要意义。
在这项研究中,研究人员运用了多种技术方法来实现目标。他们整合了多个公开的肿瘤数据集,如 TCGA、SCAN-B 和 METABRIC,这些数据集包含了丰富的基因表达数据和临床注释信息。在数据处理上,针对不同来源的数据采用了相应的处理方式,像 TCGA 数据从特定平台下载后进行评估和处理,SCAN-B 数据则从指定数据库获取。在分类器构建方面,采用手动注释结合聚类分析和特征选择的方法,利用 PAM50 基因子集和额外标记基因,通过逐步聚类将样本分为五个亚型。此外,还运用多种统计分析方法,如 Fisher 精确检验、Kruskal-Wallis H 检验等,对基因表达数据和遗传事件进行分析,以探究不同亚型的特征和差异。
研究人员首先通过聚类分析和基因签名分数计算,开发出了半监督分子乳腺癌分类器 BCC。在这个过程中,他们发现了一些有趣的现象。在初步的层次聚类分析中,有一组样本虽然与 HER2-enriched 亚型聚集在一起,但却没有高表达的 ERBB2 基因。这就像是在一群高个子中发现了几个矮个子,它们看起来属于同一类,但又有些不同。通过进一步的分析,研究人员利用不同的基因集进行迭代,成功定义了五个乳腺癌亚型:HER2-high、HER2-low、LumA、LumB 和 Basal。而且,HER2-low 样本在基因表达模式上与 HER2-high 样本有相似之处,这表明它们之间可能存在某种紧密的联系。
为了评估 BCC 的性能,研究人员将其应用于多个数据集的样本分类,并与 PAM50 分类进行比较。结果发现,BCC 分类在很大程度上与 PAM50 亚型分类一致,总体上有 85% 的样本分类结果相符。不过,BCC 在某些方面表现得更加出色。在与 HER2 表达的一致性上,BCC 的 HER2-enriched 亚型与 IHC 检测的 HER2 表达一致性更高,其中 77% 的样本被 IHC 认定为 HER2 阳性,而 PAM50 的 HER2-enriched 亚型中这一比例仅为 63%。在生存分析方面,虽然大多数情况下 BCC 和 PAM50 分类的样本生存率没有显著差异,但在 TCGA 队列中,BCC 定义的 HER2-enriched 亚型的五年生存率略低于 PAM50 定义的该亚型。这一系列结果表明,BCC 在乳腺癌亚型分类上具有一定的优势。
研究人员还对 PAM50 Normal-like 肿瘤进行了深入研究。通过病理评估和基因表达分析,他们发现 PAM50 Normal-like 肿瘤存在一些特殊之处。这类肿瘤含有大量的脂肪组织和 DCIS(导管原位癌)成分,而且其基因表达特征与 Luminal 亚型更为相似。在脂肪基因签名水平上,它与 LumA 亚型没有明显差异,在增殖和角蛋白签名方面也与 LumA 亚型相似。此外,PAM50 Normal-like 分子亚型在 IHC 亚型中表现出异质性,并且与 PAM50 LumA 组的生存率没有显著差异。这些发现对 PAM50 Normal-like 亚型作为一个独立组的分类提出了挑战,表明它更可能是 Luminal 亚型的一部分。
临床上,LumA 和 LumB 亚型通常通过 KI67 蛋白水平来区分,KI67 蛋白可反映肿瘤的生长速率 。研究人员利用这一特性,通过训练逻辑回归分类器来区分 LumA 和 LumB 亚型。结果显示,BCC 在这方面表现优异。在识别更具侵袭性的 LumB 亚型患者时,BCC 的召回率从 PAM50 的 0.46 显著提高到 0.85。而且,BCC 定义的 LumA 和 LumB 亚型在生存率上也有明显差异,这进一步证实了 BCC 在区分这两个亚型上的有效性,能够更好地预测患者的预后。
对于新定义的 HER2-low 亚型,研究人员也进行了详细的特征分析。通过对多个数据集样本的分析,他们发现 BCC HER2-low 亚型具有独特的特征。从 HER2 表达和扩增情况来看,只有 6% 的 BCC HER2-low 样本通过 IHC 检测为 HER2 阳性,6% 的样本通过 ISH 检测有 HER2 扩增,而 BCC HER2-high 亚型在这方面的比例则高得多。在组织学亚型方面,BCC HER2-low 亚型主要是浸润性非特殊型癌(Invasive Non-special type Carcinoma,NST),占比 84% 。此外,HER2-low 样本与 Burstein TNBC-LAR 亚型存在显著重叠,其 AR 基因表达较高。这些特征表明 BCC HER2-low 亚型是一个独特的分子亚型,与其他亚型存在明显差异。
研究人员将 BCC HER2-low 亚型与 IHC 定义的 HER2-low 样本进行比较,发现 BCC 能够更好地对乳腺癌样本进行分层。在 TCGA 队列中,92% 的 BCC HER2-low 患者的 ERBB2 表达在之前定义的 IHC HER2-low 一致性截断范围内,而且 BCC HER2-low 组中 96% 的样本符合 RNA 截断值定义的 HER2-low 样本标准,不包含其他亚型的样本。相比之下,IHC HER2-low 组则包含了多种其他亚型的样本,显示出明显的异质性。这充分说明 BCC 在 HER2 状态分层上比 IHC 更具优势。
研究人员对不同 BCC 亚型的基因表达模式进行了分析,发现各亚型都具有预期的特征。Luminal 亚型高表达激素受体基因(ESR1、PGR)、管腔标记基因(GATA3、FOXA1)等;HER2-high 亚型的 ERBB2 表达最高,同时细胞周期和有丝分裂相关基因也高表达;Basal 亚型则高表达基底表型标记基因(FOXC1、KRT11)等,低表达激素受体基因等。而 HER2-low 亚型具有中间特征,它与 HER2-high 亚型相似,但 ERBB2 和 GRB7 表达较低,同时具有最高的 EGFR 和 CLDN8 表达以及最低的 IGF1R 表达 。在信号通路方面,HER2-low 亚型在雄激素、缺氧和 p53 介导的通路中得分最高,在雌激素介导的通路中得分最低。这些基因表达和通路特征进一步揭示了各亚型的生物学特性。
研究人员分析了 BCC 亚型的生存趋势,发现 HER2-high 和 HER2-low BCC 亚型的生存结果明显较差。在 SCAN-B 队列中,HER2-low 亚型的生存轨迹与 Basal 组更为相似,这再次表明 HER2-low 亚型具有独特的生物学和临床特征。而且,这种生存差异在多变量 Cox 回归模型中仍然显著,这意味着 BCC 能够有效地反映乳腺癌的临床行为,为临床治疗提供重要参考。
为了验证 BCC 的有效性,研究人员创建了一个平台独立的机器学习分类器,并进行了一系列验证实验。他们将 TCGA 和 SCAN-B 数据集的样本混合并划分训练集和测试集,结果显示分类器在测试数据上对 Basal、HER2-high 和 HER2-low 亚型的 F1 分数分别达到 0.99、0.95 和 0.82 ,表现出较高的性能。随后,将分类器应用于来自 15 个不同乳腺癌数据集的 3165 个样本进行验证,结果表明预测的亚型基因表达模式与初始分类相似,并且进一步证实了 HER2-low 亚型患者生存率较低的结论。这一系列验证实验充分证明了 BCC 的可靠性和有效性。
这项研究通过开发 BCC 分类器,为乳腺癌的分子分类带来了新的突破。BCC 能够更精确地识别 HER2-low 亚型,重新定义了 PAM50 Normal 亚型,为乳腺癌的精准治疗提供了更准确的分子依据。在临床应用中,BCC 可以帮助医生更准确地判断患者的预后,制定更个性化的治疗方案。例如,对于 HER2-low 亚型患者,可以根据其独特的分子特征,探索更有效的靶向治疗方案,如针对 EGFR、HER2 等靶点的治疗。同时,BCC 也有助于优化现有治疗资源的分配,避免对不必要的患者使用昂贵的治疗药物,提高治疗的性价比。不过,研究人员也指出,虽然 BCC 展现出了巨大的潜力,但在广泛应用之前,还需要在精心设计的临床试验中进一步验证,以确保其能够真正改善患者的治疗效果和预后。