编辑推荐:
为解决大型国际病理学外部质量评估(EQA)方案无法评估基于形态学的生物标志物及满足地方需求的问题,瑞典研究人员开展了针对乳腺癌病理的数字化 EQA 研究。结果显示,2021 - 2023 年相关评估一致性提升,该研究有助于提升病理诊断质量1215。
在癌症治疗日益个性化的当下,病理学家对恶性肿瘤预后和预测生物标志物的分析结果,成为治疗决策的关键依据。然而,目前许多大型国际外部质量评估(EQA)方案存在缺陷,比如 NordiQC、UKNEQAS 等,它们大多聚焦于免疫组化(IHC)和遗传学,忽视了苏木精 - 伊红(HE)染色切片的基本组织形态学评估;而且实验室自主选择参与项目,难以发现自身潜在问题。同时,瑞典相关部门对实验室的监管也并不严格,没有强制要求实验室进行认证或参与特定 EQA 方案。在这样的背景下,开展一项能弥补这些不足的研究显得尤为重要。
瑞典的研究人员针对这些问题展开了研究。他们通过自下而上的方式,发起了灵活的瑞典数字病理学 EQA 项目,重点关注乳腺癌诊疗临床决策中关键且存在问题的生物标志物,如人表皮生长因子受体 2 低阳性(HER2-low positivity)、Ki67 和组织学分级(NHG)等。该研究成果发表在《Virchows Archiv》杂志上。
研究人员开展此项研究时,运用了以下几个主要关键技术方法:首先,由瑞典乳腺癌病理专家小组(KVAST Breast)挑选病例,将全组织切片进行染色、匿名化和数字化处理后上传至数字 EQA 平台;然后,参与实验室的病理学家在 Equalis 在线平台独立评估病例并提交答案;最后,基于部门答案,运用 Fleiss 多评级 kappa 统计方法计算观察者间的可靠性345。
研究结果如下:
- 2021 年 EQA 轮次:24 个实验室参与,其中 3 个来自挪威,21 个来自瑞典。部分实验室仅提交个人答案未参与实验室间比较。
- 诺丁汉分级(NHG):所有病例正确答案比例为 88%,总体 kappa 值为 0.50,属中等一致性,对 NHG 3 的一致性最高,NHG 1 最低67。
- 雌激素受体(ER)和孕激素受体(PR):ER 评估一致性极佳(kappa = 1),PR 评估 kappa 值为 0.75,区分 PR 高低表达时一致性良好8。
- HER2:HER2 免疫组化评分正确或可接受比例为 97% ,对 HER2 3 + 一致性极佳,但对 1 + 一致性仅为中等。HER2 最终状态评估正确率为 97%,但原位杂交(SISH)评估分歧较大910。
- 2023 年 EQA 轮次:25 个病理学实验室参与,仅 1 个实验室只提供个人答案。
- NHG:正确答案比例为 96%,总体 kappa 值为 0.64,属实质性一致,对 NHG 3 一致性最高,NHG 2 最低1112。
- HER2:正确答案比例为 96%,观察者间一致性为 0.54,对 HER2 0 一致性较高,对 2 + 和 1 + 一致性为公平到中等13。
- Ki67:正确答案比例最高,达 98%,总体一致性为实质性(0.61) ,但中间组一致性稍低14。
研究结论和讨论部分指出,诺丁汉分级系统存在一定问题,病理学家在区分 NHG 1 和 NHG 2 时不够准确,未来需定期校准数字化切片的分级。Ki67 作为生物标志物存在争议,目前的阈值设定有助于提高一致性,且多数瑞典实验室已使用人工智能辅助评分,未来 EQA 应适应数字化趋势。HER2 评估中,病理学家对染色程度判断存在困难,2023 年聚焦 HER2-low 类别,导致 kappa 值降低。而 ER/PR 评估在各实验室间一致性良好。
这项研究意义重大,瑞典的 EQA 方案聚焦形态学评估,弥补了大型国际 EQA 方案的不足,能根据地方需求灵活调整,其结果与国家病理指南直接相关,可促进地方病理诊断质量提升,推动癌症治疗中生物标志物评估的发展,助力实现精准医疗,为全球病理学质量评估提供了新的思路和参考。