编辑推荐:
本文通过多种分析方法,全面梳理 HER2 低表达乳腺癌研究进展,为后续研究提供方向。
1. HER2 低表达乳腺癌研究背景
乳腺癌是全球女性中最常见的癌症,HER2 低表达乳腺癌约占所有乳腺癌的 45%-55%。传统上,HER2 状态分为阳性(IHC 3 + 或 2+ /ISH+)或阴性(IHC 2+ /ISH-、IHC 1 + 或 IHC 0),随着抗体药物偶联物(ADC)的出现,IHC 2+ /ISH - 和 IHC 1 + 的乳腺癌被重新定义为 HER2 低表达乳腺癌。
DESTINY-Breast04 研究显示,T-DXd 改善了 HER2 低表达患者的无进展生存期(PFS)和总生存期(OS),此后,HER2 低表达乳腺癌的研究迅速发展。然而,HER2 低表达肿瘤能否作为一个独立亚型仍存在争议,在临床病理特征、对患者预后和治疗结果的影响、病理诊断等方面都有待明确,同时新 ADC 药物的临床效益和安全性也需进一步评估。
为解决这些问题,开展了大量临床研究,还运用基因组和转录组方法探究 HER2 低表达乳腺癌的基因图谱。本研究采用文献计量分析、知识图谱、话语原子主题建模(DATM)等方法,分析研究热点、重要成果、主要研究领域和新兴趋势。
2. 研究结果
2.1 出版物数量和引用频率的统计分析
2004 - 2023 年,HER2 低表达乳腺癌研究领域的出版物数量显著增加,2019 年起呈急剧上升趋势。美国和中国在研究方面处于领先地位,其出版物数量在 2021 年和 2022 年达到峰值。2019 年起,引用次数和出版物数量同步大幅增长。2014 - 2023 年该领域的十年中位影响因子呈波动趋势,2020 年达到峰值,虽 2021 - 2023 年略有下降,但仍保持较高水平。
2.2 共现分析
通过对国家、机构、作者和期刊的共现网络分析发现,美国、中国和意大利是出版物数量最多的三个国家,美国在该领域合作最为紧密。在机构方面,米兰大学、丹娜 - 法伯癌症研究所和 MD 安德森癌症中心是主要的研究机构。作者中,Curigliano Giuseppe 的出版物数量最多,他主要研究 HER2 低表达乳腺癌的诊断、治疗和进化生物学属性。在期刊方面,《临床肿瘤学杂志》《临床癌症研究》等是被引用次数最多的期刊,《临床肿瘤学杂志》在该领域影响力广泛。
2.3 基于参考文献共被引的聚类分析
通过对高被引文献的分析发现,2009 年的文献率先探讨了 HER2 低表达状态与乳腺癌患者阳性结节不良预后的关系。2015 - 2022 年,学者们深入研究 HER2 低表达乳腺癌的病理和临床特征、转移特性、分子属性、生物标志物、流行病学特点和异质性。2020 - 2022 年,大量研究聚焦于针对 HER2 的 ADC 药物对 HER2 低表达乳腺癌的治疗潜力。近期研究热点包括 “单臂荟萃分析(2023)”“曲妥珠单抗德鲁替康(T-DXd,2023)” 和 “新治疗选择(2023)”。
2.4 关键词分析
对关键词的分析表明,“ADC” 概念于 2018 年首次提出,“HER2 低表达乳腺癌” 于 2021 年出现在文献中。2021 - 2023 年,T-DXd 的出现频率显著增加,这表明其在乳腺癌治疗方面具有潜在价值。
2.5 主题建模和文章聚类
通过主题建模确定了 6 个主题,分别为 HER2 检测、新辅助治疗与预后、ADC 药物进展、组学与临床生物标志物、基础与转化研究、临床试验。聚类分析显示,“新辅助治疗与预后” 和 “高通量多组学诊断与治疗” 主题下有许多重叠文章。“检测” 主题与 “ADC 药物进展” 和 “新辅助化疗与预后” 密切相关。2004 - 2019 年和 2020 - 2023 年的关键词变化,反映了研究重点的转移,如 2020 年后对循环肿瘤细胞(CTCs)和自然杀伤(NK)细胞的关注度增加。
2.6 知识图谱
从知识图谱中列出了 9 种 ADC 药物,包括 T-DM1 和 T-DXd,并展示了相关临床试验、药物成分、作用机制、连接子、靶点和药物相关不良反应及其相关性。M1231 有两个靶点,不良反应较少,可能是一种具有潜力的药物。T-DXd、MRG002 和 A166 在治疗 HER2 低表达乳腺癌方面比 T-DM1 更有效。对 13 项相关临床试验的分析表明,PFS 和不良事件(AEs)是主要测量指标,目前临床试验主要围绕 HER2 低表达晚期 / 转移性乳腺癌展开,涉及 T-DXd 的多项 3 期临床试验显示出其治疗 HER2 低表达乳腺癌的潜力和优势。
2.7 话语原子主题建模
通过 DATM 分析,发现不同药物与特定主题存在关联。例如,sacituzumab govitecan(SG)和 T-DXd 都含有拓扑异构酶 I 抑制剂有效载荷,两者都是有前景的 ADC 药物。SYD985 与多个主题强相关,在 DATM 中显示出在免疫治疗联合领域的潜力,以及在不同恶性肿瘤体外试验中的应用前景。
3. 研究讨论
3.1 HER2 检测
HER2 低表达乳腺癌具有异质性,HER2 表达状态在疾病演变过程中不稳定。目前 HER2 低表达乳腺癌的病理诊断缺乏一致性和明确标准。为解决这些问题,可采取多次活检、利用人工智能辅助病理检测、应用定量免疫荧光方法(如 AQUA?方法)、进行计算机辅助定量图像分析(QIA)等措施。
3.2 组学与临床生物标志物
HER2 低表达乳腺癌缺乏特定的组学特征和生物标志物。多参数 MRI 影像组学特征有望成为识别乳腺癌 HER2 表达的非侵入性工具。核心针穿刺活检(CNB)能提供重要的组学信息,蛋白质组学在 HER2 低表达乳腺癌研究中具有重要意义。除经典指标 Ki-67 外,可关注 PIK3CA、NF145、NBR146、BRCA1/2 等新的诊断标志物,甚至开发新的诊断和预后模型。CTCs 作为预后指标,在 HER2 低表达乳腺癌研究中也具有重要价值,未来可探索多种检测方法的联合应用。
3.3 基础与转化研究
HER2 低表达乳腺癌的研究正从基础研究向临床转化阶段过渡。NK 细胞在 2020 年后受到更多关注,其在肿瘤免疫中发挥重要作用,通过促进 NK 细胞活性可提高治疗效果。多种新兴治疗方式,如单克隆抗体(Margetuximab)、双特异性抗体(ZW25)等,在临床前模型中显示出抗癌活性,但肿瘤疫苗(Nelipepimut-S)目前尚未显示出明显益处。同时,需要进一步研究不同乳腺癌亚型肿瘤微环境(TME)的差异,新兴疗法和基础研究将为优化个性化精准治疗提供支持。
3.4 新辅助治疗与预后
在新辅助治疗患者群体中评估生物学参数,以验证 HER2 低表达乳腺癌与 HER2 - 0 乳腺癌的差异。HR 状态在 HER2 低表达乳腺癌新辅助治疗预后中受到关注,但不同研究结论不一致。这可能与 HER2 低表达乳腺癌的独特性质、患者间异质性以及种族和民族差异有关。综合分析认为,HER2 低表达乳腺癌的生物学特征预后差异更可能依赖于 HR 状态,HR 阴性亚组的 pCR 率更高,预后更好。
3.5 ADC 药物进展与临床试验
ADCs 被认为是 HER2 低表达乳腺癌有前景的治疗方法,围绕其开展了一系列临床试验。目前研究主要集中在 HER2 低表达晚期 / 转移性乳腺癌,早期阶段研究有待加强,主要研究药物为 T-DXd。
- ADCs 的安全性和不良事件:T-DXd 是一种高致吐性抗肿瘤药物,常见不良反应包括间质性肺疾病(ILD)和非感染性肺炎等肺部并发症。使用 ADC 药物时,需加强副作用的预防和管理,开发更安全的 ADC 药物以降低 3 级及以上治疗相关不良事件(TRAEs)的发生率。
- ADC 药物的耐药性及对策:药物耐药是影响 ADC 药物疗效的主要因素,HER2 表达下调、靶基因激活突变等是耐药机制。新型 ADC 药物和联合治疗可有效应对耐药问题,如双特异性 ADC 药物和联合使用 TKIs、CDK4/6 抑制剂、PARP 抑制剂等。
- 新的潜在 ADC 药物如 SYD985:除 T-DXd 外,SYD985 等也是潜在的 ADC 药物。SYD985 与多个主题相关,在 HER2 阳性转移性乳腺癌治疗中显示出积极结果,在联合免疫治疗和不同恶性肿瘤治疗方面具有潜力。此外,还有针对 Trop2、HER3、B7-H4 等靶点的 ADC 药物,如 Sacituzumab govitecan(SG)在 HER2 低表达乳腺癌治疗中也有潜力,但需明确 T-DXd 和 SG 等药物的最佳治疗顺序。
3.6 研究局限性
本研究仅检索了 Web of Science 数据库 SCIE 核心集中的英文文献,可能排除了其他语言的高质量文献,导致聚类分析中不同内容类别存在重叠。出版物时间差异会影响总引用频率,共现关键词节点数量有限也会影响结论准确性。此外,不同研究人员对结果的主观解释和自然语言处理主题建模方法中参数设置的差异,也可能导致结果存在一定的异质性。
3.7 研究展望
HER2 低表达乳腺癌有作为独立亚型的潜力,但需要克服一些关键挑战。制定病理诊断标准并结合 AI 技术提高诊断准确性,开发新的独立诊断系统,如 CTCs、影像学特征和蛋白质组学等。克服 ADC 药物的技术难题,包括耐药性、异质性和治疗相关不良事件风险。进一步研究除 T-DXd 外的其他 ADC 药物,为早期 HER2 低表达乳腺癌患者提供更有效的治疗选择,为 HER2 低表达乳腺癌作为独立新亚型提供有力证据。
4. 研究结论
本研究通过文献计量分析和知识图谱构建,全面展示了 HER2 低表达乳腺癌领域的研究现状、新兴趋势和未来方向。T-DXd 改变了 HER2 低表达乳腺癌的治疗格局,知识图谱和 DATM 为了解 ADC 药物的机制、靶点和不良反应提供了有价值的信息,有助于探索新兴治疗策略,推动 HER2 低表达乳腺癌作为独立亚型的研究。
5. 研究方法
本研究遵循 PRISMA 报告指南,因属于纯文献计量和主题建模研究,中国医科大学附属第一医院伦理委员会认为无需伦理审批。研究数据来源于 Web of Science 核心合集(WoSCC),检索 2000 - 2023 年的数据,经筛选和清洗后得到 466 篇有效论文。
5.1 文献计量分析
提取文章的期刊信息、参考文献数据、作者单位和姓名等,使用 Microsoft Excel 2021、Scimago Graphica、CiteSpace(V.6.1.R6)、VOSviewer(V1.6.18)和 R 包 Bibliometrix(V.4.0.1)等工具进行分析,并利用 Python 包 matplotlib(V.3.6.2)和 wordcloud(V.1.8.2.2)制作词云图。
5.2 主题建模和文章聚类
采用主题建模技术,如潜在狄利克雷分配(LDA),通过计算词共现频率确定文章与主题的相关性,并根据多种标准确定主题数量。运用结构深度聚类网络(SDCN)和聚类大应用(CLARA)算法对文章进行聚类分析。在分析前,对数据进行预处理,包括初步整理、去除停用词等。
5.3 知识图谱
构建 ADC 药物知识图谱,通过查询 PubMed 获取科学论文摘要,使用 GPT-4 确定实体关系,建立包含节点类型和关系的本体,将提取的实体和关系与本体匹配,生成 Cypher 代码并导入 Neo4j 图数据库,利用 GraphXR 平台进行进一步分析。
5.4 话语原子主题建模(DATM)
从 PubMed 检索 18,801 篇文章,运用 K - 奇异值分解(K-SVD)对词向量进行处理,得到 “话语原子”,以此进行主题建模。通过三个指标评估模型,最终选择包含 60 个主题的模型。