编辑推荐:
为解决甲状腺癌诊断中,不确定甲状腺结节诊断困难及基因突变预测挑战等问题,中山大学附属第八医院等单位研究人员开展甲状腺细胞学图像预测 BRAFV600E和 RAS 突变研究。结果良好,能辅助诊断,推荐科研读者阅读。
在医学领域,甲状腺癌是内分泌系统中最常见的恶性肿瘤之一。随着超声检测技术的进步,甲状腺结节的检出率大幅提高。甲状腺癌主要分为乳头状甲状腺癌(PTC,70 - 90%)、滤泡状甲状腺癌(FTC,5 - 10%)、未分化甲状腺癌(ATC,2%)和髓样甲状腺癌(MTC,2% 以下) 。其中,大部分 PTC 患者在接受标准治疗后预后良好,10 年生存率可达 96%,但仍有 5 - 10% 的患者会发展为晚期疾病,预后较差。所以,早期精准诊断对患者来说至关重要,它能避免过度治疗或治疗不足。
目前,超声引导下的细针穿刺(FNA)结合液基薄层细胞学(TCT)是临床鉴别甲状腺结节良恶性的可靠方法。不过,当遇到细胞学特征不明显的结节时,病理学家依据贝塞斯达系统(TBS)分类,会将其归为不确定类别(TBS3:意义不明的不典型增生或 TBS4:意义不明的滤泡性肿瘤 / 滤泡性病变),这让诊断陷入困境。随着诊断技术的发展,分子检测融入了甲状腺癌的诊疗过程。对 FNA 样本进行基因分析,不仅能提高术前细胞学诊断的准确性,还能预测侵袭风险,为甲状腺结节患者的治疗决策提供信息。
在甲状腺癌的发生和发展过程中,丝裂原活化蛋白激酶(MAPK)和磷脂酰肌醇 3 - 激酶(PI3K)这两条信号通路的基因改变起着重要作用。其中,BRAFV600E突变在超过 80% 的 PTC 患者中被发现,RAS(包括 NRAS、KRAS、HRAS)突变则出现在 10 - 15% 的 PTC 患者中。这些突变激活了 MAPK 信号通路,促进了甲状腺肿瘤的进展和转移。此外,BRAFV600E突变还与放射性碘治疗的敏感性降低密切相关,而 RAS 基因突变在甲状腺腺瘤中较为常见,凸显了其在甲状腺滤泡细胞癌变中的重要性。
传统的基因分析方法,如扩增阻滞突变系统聚合酶链反应(ARMS PCR),虽然灵敏度和特异性较高,但在临床应用中受到诸多限制,比如对实验室和样本质量要求苛刻、实验步骤耗时、专业人员稀缺等。
随着深度学习技术的飞速发展,许多人工智能(AI)辅助诊断系统在肿瘤病理学领域涌现,可用于肿瘤分类、预后预测以及基因突变评估等任务。在甲状腺病理学诊断方面,已有不少研究利用 AI 技术取得了一定成果,但从甲状腺结节的 FNA 切片预测基因突变,从而增强对不确定组的恶性诊断和对 PTC 组的预后风险评估,仍然极具挑战性。
为了解决这些问题,中山大学附属第八医院等单位的研究人员在《Diagnostic Pathology》期刊上发表了题为 “Multimodal cascaded deep convolutional network for genetic mutation prediction in thyroid cytology” 的论文。研究人员提出了一种多模态级联深度卷积框架,旨在通过甲状腺细胞学全切片图像(WSIs)来预测 BRAFV600E和 RAS 基因突变,为甲状腺癌的诊断和治疗提供更有力的支持。
研究人员为开展这项研究,用到了几个主要关键的技术方法。首先是数据处理技术,收集了 702 个不同甲状腺结节的细胞学切片,经专家病理学家诊断后,将样本分为训练集、验证集和外部测试集,并对图像进行预处理,生成固定大小的图像块,同时过滤掉空白背景和噪声。其次,采用了少样本学习策略,仅对少量样本进行标注来训练区域分类器,减少人工标注工作量的同时保持良好的泛化能力。最后,构建了多模态分类器,将图像特征和临床文本记录相结合,通过多模态特征编码和多头注意力机制来预测基因突变类型 。
下面来看看具体的研究结果。
- 少样本区域分类:少样本区域分类模型生成的概率图显示,预测概率越高,图像块中包含有效诊断细胞的可能性越大。研究人员设定高阈值(0.75),选择预测概率在 0.75 - 1.00 的图像块,用于后续基因突变评估模型的训练和验证,以确保所选图像块的可靠性。
- 多模态基因突变估计:在 BRAF 突变估计任务中,该方法在训练集、验证集和外部测试集的 AUC 值分别达到 0.938(95% CI:0.917 - 0.960)、0.905(95% CI:0.849 - 0.962)和 0.902(95% CI:0.839 - 0.965);在 RAS 突变估计任务中,训练集、验证集和外部测试集的 AUC 值分别为 0.881(95% CI:0.812 - 0.951)、0.802(95% CI:0.621 - 0.984)和 0.801(95% CI:0.663 - 0.938)。这表明该方法在 BRAF 突变估计方面具有更高的准确性和稳定性。研究人员还展示了 BRAF 和 RAS 突变的代表性病例,通过观察不同突变概率的图像块,进一步分析了图像特征与基因突变之间的关系。
在研究结论和讨论部分,研究人员提出的多模态级联深度卷积框架具有重要意义。此前的研究大多聚焦于甲状腺结节良恶性的分类,而该研究首次利用深度神经网络(DNN)模型在不同诊断细胞学切片中完成全面的基因预测。少样本学习策略的运用,极大地减少了人工标注需求,同时保持了较高的分类泛化能力。利用深度卷积网络估计 BRAF 和 RAS 基因突变,为病理学家评估风险和指导治疗提供了更便捷的手段。
不过,这项研究也存在一些局限性。由于 RAS 突变数据分布相对不均衡,在区分 RAS 野生型和突变型时面临挑战,有限的阳性样本数量可能影响模型训练效果和数值的可靠性。而且,PTC 的发生和发展是一个复杂的多因素过程,研究仅关注了 BRAFV600E和 RAS Q61R 这两个热点突变,可能会误判未检测到的非热点突变或融合基因的病例,导致野生型组的异质性增加,降低模型整体准确性。此外,模型在预测过程中,由于缺乏同一张 WSI 中相邻图像块的内部连接,可能出现不一致的预测结果,而且级联分类管道中的模型分别训练和优化,需要额外的计算时间和存储。
为了改进这些不足,研究人员提出在未来的研究中,可以纳入更全面的基因组分析,捕获更多类型的突变和融合基因,提高病例分类的准确性。同时,探索构建具有共享参数和目标函数的统一模型,以提升计算效率。此外,使用包含更多临床中心、种族多样性和基因改变的更大数据集进行评估,能更全面地验证该方法的有效性和泛化性。
总的来说,这项研究为甲状腺癌的基因诊断开辟了新的道路,尽管还存在一些需要改进的地方,但它为后续研究指明了方向,有望在未来进一步提高甲状腺癌的诊断和治疗水平,为患者带来更多的希望。