《Journal of Clinical Oncology》:Methotrexate, Doxorubicin, and Cisplatin Versus Methotrexate, Doxorubicin, and Cisplatin + Ifosfamide in Poor Responders to Preoperative Chemotherapy for Newly Diagnosed High-Grade Osteosarcoma (JCOG0905): A Multicenter, Open-Label, Randomized Trial
编辑推荐:
本文聚焦骨肉瘤治疗难题,日本临床肿瘤学组开展 JCOG0905 研究。针对术前化疗(MAP 方案)低反应患者,对比 MAP 与 MAP 联合 IF 方案。结果显示,加用 IF 未改善无病生存期(DFS),总生存期(OS)反而数值更低,不支持在该类患者中加用 IF。
### 研究背景
高级别骨肉瘤若仅进行肿瘤切除,预后较差,而多药联合治疗显著改善了这一状况。在过去三十年,大型随机对照试验(RCTs)采用肿瘤切除前后使用甲氨蝶呤(MTX)、多柔比星(DOX)和顺铂(CDDP)的三药联合治疗(MAP)作为标准治疗方案。术前化疗的引入,使切除肿瘤的组织学反应成为一个重要的预后因素。对术前化疗有良好组织学反应的患者,5 年总生存期(OS)可达 68%-84%,而反应不佳(PrRsp)的患者,5 年 OS 仅为 41%-49%。目前,对于在低反应患者中添加新药物能否在不增加额外不良事件的前提下改善预后,尚不清楚。
此前,EURAMOS-1 研究是首个探讨此问题的 RCT,该研究表明,对于术前 MAP 治疗后反应不佳的患者,术后在 MAP 治疗基础上添加累积总剂量为 60g/m2的异环磷酰胺(IF)和 1.5g/m2的依托泊苷,并未改善预后,也未增加不良事件。然而,日本的 NECO93J 和 95J 临床试验则提示,对反应不佳的患者,术后在 MAP 治疗基础上单独添加更高剂量的 IF,可能会改善预后。基于此,日本临床肿瘤学组(JCOG)开展了 JCOG0905 试验,旨在确认对反应不佳的患者添加累积总剂量为 90g/m2(3g/m2每日 1 次,连续 5 天,共 6 个疗程)的 IF,是否能在克服额外不良事件和延长治疗时间的弊端后,改善患者的预后。
研究方法
JCOG0905 是一项在日本开展的多中心、开放标签、随机试验。首次注册的纳入标准为:40 岁及以下,组织学证实为可切除的高级别肢体或肢带骨肉瘤(国际抗癌联盟 [UICC] TNM 第六版分期为 IIA、IIB、III 期),且肿瘤未累及骶骨,东部肿瘤协作组体能状态评分为 0 或 1。之后,为增加入组人数,将年龄限制放宽至 50 岁,并纳入锁骨、胸骨和肋骨的肿瘤。二次注册的资格要求为:完成两个术前 MAP 周期,完全切除原发性肿瘤,术后接受一个周期的多柔比星和顺铂治疗且无疾病进展,并且已知组织学反应。
在二次注册时,采用最小化法和偏币分配法,根据 T 因素(T1 与 T2 和 T3,包括美国癌症联合委员会 [AJCC]/UICC 第六版肿瘤大小分类、肿瘤位置(下肢带与其他骨骼)和机构),将反应不佳的患者随机分配至 MAP 组(接受 MAP 治疗)或 MAPIF 组(接受 MAP+IF,即 MAPIF 治疗)。患者和治疗医生对治疗方案和结果评估均不设盲。反应良好的患者则直接接受 MAP 治疗,不进行随机分组。
注册患者先接受两个周期的术前 MAP 治疗,药物包括顺铂、多柔比星和高剂量甲氨蝶呤。术前化疗完成后 5 周内进行肿瘤切除,各机构评估组织学反应并分级,1 级和 2 级代表反应不佳,3 级和 4 级表示反应良好。术后,所有患者在二次注册前接受一个周期的多柔比星和顺铂治疗,以防止术后化疗延迟。二次注册后,反应良好的患者和 MAP 组继续 MAP 治疗,MAPIF 组开始 MAPIF 治疗,包括 6 个疗程的 IF,同时将多柔比星剂量降至 57%,甲氨蝶呤剂量降至 80%,以平衡两组的不良反应和治疗时间。在日本,右丙亚胺不可用于心肌保护。
研究的主要终点是反应不佳患者的无病生存期(DFS),定义为从二次注册到首次出现复发、继发恶性肿瘤或任何原因导致死亡的时间。次要终点包括反应良好患者的 DFS、两组从二次注册开始的 OS、术前进展患者的比例以及毒性反应。OS 定义为从二次注册到因任何原因死亡的时间。数据由 JCOG 数据中心集中收集,各机构依据不良事件通用术语标准 3.0 版进行毒性评估。
根据 Schoenfeld 和 Richter 的方法,假设 MAP 组 3 年 DFS 为 50%,MAPIF 组为 65%,要达到 70% 的检验效能,需要 MAP 组 92 例患者、58 个事件,MAPIF 组 92 例患者、58 个事件。设定首次注册样本量为 200 例患者,二次注册为 100 例(每组 50 例),预计首次注册中约 50% 的患者为反应不佳者,之后进行随机分配。在 JCOG 数据中心进行两次中期分析,分别从无效性和有效性角度评估。首次分析在获得计划随机分配患者一半的数据后进行,评估继续招募的合理性;第二次分析在二次注册所有随机分配患者完成入组后进行,评估是否继续随访。使用 Lan 和 DeMets 的 α 消耗函数以及 O'Brien 和 Fleming 类型调整中期分析和主要分析中的多重检验,以维持 10% 的总体 α 错误率。若 MAPIF 在 DFS 方面显示出对 MAP 的统计学显著优势,试验将在中期分析时终止;若 MAPIF 组的 DFS 曲线低于 MAP 组,无论统计结果如何,都将考虑终止试验。在第二次分析中,采用分层单侧对数秩检验比较 MAP 和 MAPIF 组的 DFS,将 T 因素作为分层因素,在意向性治疗人群中进行分析。根据试验设计,主要终点结果报告单侧 P 值,同时按照《临床肿瘤学杂志》(JCO)指南,报告双侧 P 值作为参考。使用 Cox 回归根据 T 因素分层估计 DFS 的风险比(HR)及其 95% 置信区间(CI),对 OS 使用未分层的 Cox 回归。DFS 和 OS 采用 Kaplan-Meier 方法估计。术前进展患者比例的 CI 使用 Clopper-Pearson 方法估计。所有反应不佳患者的中位随访时间采用反向 Kaplan-Meier 方法计算。所有统计分析均使用 SAS 9.4 软件完成。该试验在日本临床试验注册中心(jRCT;jRCTs031180126)注册。资助者在研究设计、数据收集、分析、解释、报告撰写和发表决策方面均无参与。
研究结果
2010 年 2 月 16 日至 2020 年 8 月 21 日,共注册 287 例患者,直至 100 例反应不佳的患者完成随机分配。二次注册于 2021 年 1 月 22 日结束,103 例反应不佳的患者被随机分配,其中 51 例接受 MAP 治疗,52 例接受 MAPIF 治疗。287 例患者中,18 例被判定为不合格,包括 3 例诊断变更不符合标准、11 例乙肝检测不充分、1 例注册后出现肺转移和 1 例不符合注册规定。还有 2 例患者在注册前开始治疗,违反了注册协议。排除 3 例诊断变更的患者后,其余 15 例中有 11 例进入二次注册。未进入二次注册的最常见原因是疾病进展和患者拒绝随机分配。
所有反应不佳患者的中位随访时间为 67.1 个月(95% CI:54.9 - 79.2 个月)。MAP 组有 3 例患者在随机化后 1.6 年、2.5 年和 4.1 年失访。基于第二次中期分析结果,JCOG 的数据和安全监测委员会建议终止研究,因为主要终点 DFS 的 HR 超过了预先设定的值 1.0。随机分配患者首次注册时的基线特征在两组间均衡可比。
在 103 例随机分配的患者中,发生了 38 例 DFS 事件(MAP 组 18 例,MAPIF 组 20 例)。DFS 的 HR 为 1.05(95% CI:0.55 - 1.98),两组 3 年 DFS 均为 64.3%(分层对数秩检验:单侧 P = 0.55,双侧 P = 0.89)。共发生 26 例死亡事件(MAP 组 11 例,MAPIF 组 15 例),均因原发性疾病导致。OS 的 HR 为 1.48(95% CI:0.68 - 3.22),MAP 组和 MAPIF 组 3 年 OS 分别为 86.5%(95% CI:72.4 - 93.7)和 78.8%(95% CI:64.1 - 88.0)。按性别、T 因素和组织学反应进行的亚组分析显示,与治疗效果在 DFS 或 OS 方面均无交互作用。
在反应良好的患者中,3 年 DFS 为 74.9%(95% CI:62.1 - 83.9),3 年 OS 为 91.7%(95% CI:81.0 - 96.5)。有 7 例死亡,其中 5 例因原发性疾病,2 例因治疗相关原因。反应良好和反应不佳患者之间 DFS 和 OS 的 HR 分别为 0.59(95% CI:0.34 - 1.03)和 0.38(95% CI:0.17 - 0.88)。在 267 例接受术前化疗的患者中,35 例(13.1%)在术前出现疾病进展(95% CI:9.3 - 17.8)。MAPIF 组中,19 岁及以下 36 例患者的 IF 中位累积总剂量为 79.8g/m2(IQR:45.4 - 86.2),20 - 29 岁 9 例患者为 77.1g/m2(IQR:44.0 - 79.5),30 - 39 岁 2 例患者为 80.7g/m2(IQR:73.2 - 88.3)。
术前和二次注册前首次术后化疗的不良事件数据在附录中描述。有 1 例患者在术前化疗期间,因怀孕、死产后开始治疗,最终死于感染性休克。术后化疗期间,两组均观察到严重骨髓抑制和发热性中性粒细胞减少(>30%)。MAPIF 组出现中枢和周围神经病变、膀胱炎,肾功能障碍作为晚期不良反应的发生率较高。74 例反应良好的患者中有 2 例(2.7%)出现左心室功能障碍,治疗后死于心力衰竭,MAP 组和 MAPIF 组未发生此类事件。
MAP 组有 2 例患者出现转移,2 例因口腔炎和听力障碍拒绝治疗,最终 44 例患者完成治疗。MAPIF 组中,4 例患者在术后首个 IF 疗程后停止治疗,原因分别为 3 级嗜睡和不自主运动、呼吸窘迫、肾功能障碍和血液学毒性。在第二个 IF 疗程后,4 例患者停止治疗,2 例因疾病进展,1 例因 3 级脑病,1 例因 2 级脑病。此外,8 例患者在第 5 - 10 个疗程之间停止治疗,4 例因血液学毒性,2 例因疾病进展,2 例因适应障碍和专注于学习,最终 32 例患者完成治疗。在二次注册前出现进展的 35 例患者中,2 例发生继发恶性肿瘤,1 例患白血病,另 1 例患骨髓增生异常综合征,两人在骨髓移植后均死亡。
研究讨论
标准的骨肉瘤治疗包括术前 MAP 化疗、肿瘤广泛切除和术后化疗,这种方法有助于评估组织学反应这一重要预后因素。此前有研究尝试通过给反应不佳的患者使用额外药物来改善预后,但 EURAMOS-1 研究和本 JCOG0905 研究均表明,添加 IF 并未改善预后。在 JCOG0905 研究中,对反应不佳的患者添加 90g/m2的 IF,未改善 DFS,且 OS 有降低趋势。
EURAMOS-1 和 JCOG0905 试验针对反应不佳患者的治疗框架相似,且招募期部分重叠。尽管 JCOG0905 试验在 IF 剂量、给药时间和方式、药物组合以及研究人群等方面与 EURAMOS-1 存在差异,但两项试验在主要终点上结果相近。
在 JCOG0905 研究中,注册患者中有 2 例继发恶性肿瘤,均发生在术前治疗期间,二次注册患者中未报告继发恶性肿瘤,这可能与随访时间较短和数据不成熟有关,因此长期随访中对继发恶性肿瘤的监测至关重要。JCOG0905 研究中,MAPIF 组 DFS 与 MAP 组相当,但 OS 较短,可能是因为 MAPIF 组多柔比星和甲氨蝶呤累积剂量较低。目前尚无试验在同质患者群体中专门研究不同累积剂量多柔比星或甲氨蝶呤的影响,这使得对结果的明确解释存在困难,但该结果可能会影响未来临床试验。
本试验与 EURAMOS-1 试验中反应不佳患者的比例存在差异,这是由于 EURAMOS-1 术前使用更高累积剂量的多柔比星、评估方法和数据汇总标准不同等因素导致的,使得两者难以直接比较。
MAP 组 92% 的患者完成治疗,MAPIF 组仅 67% 的患者完成治疗。MAPIF 组因 IF 不良反应导致的早期停药情况较多,证实了高剂量 IF 治疗的显著毒性。MAPIF 组 1 级组织学反应比例高于 MAP 组,虽亚组分析显示不同组织学分级下两组 DFS 有差异,但经 Cox 回归模型调整后,这种不平衡对主要结果的影响可能较小。
JCOG0905 研究支持了 EURAMOS-1 的结果,展示了其在亚洲人群中的适用性。然而,该研究存在样本量小、单侧 α 为 0.1、统计效能 < 70% 等局限性。IF 作为一种对骨肉瘤有活性的药物,在随机对照试验中未能显示出优势,这表明 MAP 和 IF 的作用靶点可能存在较大重叠。骨肉瘤细胞中过表达突变的 GPC3 会导致多药耐药,因此需要具有新作用机制的新型药物。此外,寻找比组织学反应评估更早估计术前化疗效果的生物标志物,对于改善治疗至关重要。
综上所述,辅助性 MAPIF 治疗相比 MAP 治疗,并未改善 DFS,OS 反而有降低趋势,且毒性更大。JCOG0905 研究结果不支持在反应不佳的患者中添加 IF,即便其剂量比 EURAMOS-1 研究中的高 1.5 倍。未来需要克服基于组织学反应评估修改术后化疗的长期限制,探索新的策略,如循环肿瘤 DNA 分析和具有新作用机制的药物研究。