编辑推荐:
乳腺癌(BC)严重威胁女性健康,其分子亚型对治疗和预后意义重大。研究人员利用跨窗 Transformer(CW Transformer)基于数字乳腺断层合成(DBT)图像进行 BC 分子亚型分类研究。结果显示该方法分类性能显著提升,有助于 BC 早期精准治疗。
在女性健康的战场上,乳腺癌犹如一颗 “定时炸弹”,时刻威胁着无数女性的生命安全。乳腺癌并非单一的疾病类型,它有着不同的分子亚型,像管腔 A 型(luminal A)、管腔 B 型(luminal B)、人表皮生长因子受体 2 富集型(HER2-enriched)以及三阴性(TN)。这些分子亚型在疾病表现、治疗反应、预后情况和生存结局等方面都有着天壤之别 。比如,不同分子亚型的乳腺癌患者,对同一种治疗药物可能会有完全不同的反应,有的患者疗效显著,病情得到有效控制;而有的患者却可能毫无效果,病情持续恶化。这就使得术前准确判断乳腺癌的分子亚型变得至关重要,它是制定精准治疗方案的关键前提。
以往,研究人员主要借助卷积神经网络(CNNs)来预测乳腺癌分子亚型。然而,随着研究的深入,问题逐渐暴露出来。视觉 Transformer(ViT)在图像分类任务上虽取得了不错的成绩,但面对高分辨率图像时,其自注意力机制的计算复杂度与图像大小呈二次方关系,这就导致在处理高分辨率的乳腺癌图像时,计算量巨大,难以高效运行。为了解决这些难题,来自国内的研究人员挺身而出,开展了一项极具意义的研究。他们提出了跨窗 Transformer(CW Transformer),并将其应用于基于数字乳腺断层合成(DBT)图像的乳腺癌分子亚型分类研究中。最终,研究取得了令人瞩目的成果,为乳腺癌的早期诊断和精准治疗带来了新的希望。该研究成果发表在《Biomedical Signal Processing and Control》上。
研究人员在开展这项研究时,运用了多个关键技术方法。首先,他们收集了 107 例经病理确诊为乳腺癌患者的 DBT 图像,并从中选取 4000 张 2D 图像作为研究样本。其次,提出了 CW Transformer 模型,该模型通过交叉窗多头自注意力(CW-MSA)机制,在不同大小感受野(RFs)的窗口中学习局部和全局信息;同时引入基于空间和通道的分组可分离卷积(GSC-SC)模块,以更好地提取特征。此外,研究采用 7:1:2 的比例将数据划分为训练集、验证集和测试集,并利用 Python 和 Pytorch 深度学习库,在 NVIDIA RTX 4090 GPU 上进行模型训练和评估。
研究结果
- 模型分类性能评估:研究人员使用测试数据集和 3 折交叉验证对 CW Transformer 进行评估。在 3 折交叉验证中,将所有图像均匀分为 3 个子集,每次取 2 个子集训练,剩余 1 个子集测试,重复 3 次直至所有图像都被测试。结果显示,与骨干网络(Single-path)相比,CW Transformer 的分类性能显著提升,其受试者工作特征曲线下面积(AUC)达到 0.829,准确率(ACC)为 0.775,灵敏度(SEN)为 0.914,特异性(SPE)为 0.636。这表明 CW Transformer 在乳腺癌分子亚型分类上具有较高的准确性和可靠性。
- 模型优势分析:CW Transformer 的核心优势在于其 CW-MSA 模块。基于不同 RFs 的窗口设计,使得网络能够更高效地学习局部和全局信息。窗口的引入降低了自注意力的计算复杂度,同时通过捕获跨窗连接,有效解决了小感受野窗口边缘的边界效应问题。而 GSC-SC 模块则根据空间和通道分组,进一步提取了更多有用的特征图像,从而提升了模型的分类性能。
研究结论与讨论
本研究成功提出了基于 DBT 图像的 CW Transformer 用于乳腺癌分子亚型分类。该模型能够从不同大小 RFs 的窗口中学习局部和全局信息,小 RFs 窗口捕获局部信息,大 RFs 窗口捕获跨窗(全局)信息,GSC-SC 模块进一步增强了分类性能。这一研究成果为乳腺癌的早期分子亚型分类提供了一种新的、有效的方法,有助于医生更准确地判断病情,制定个性化的治疗方案,从而提高乳腺癌患者的治疗效果和生存率。然而,研究也存在一定的局限性,例如数据集中样本数量相对有限,可能会影响模型的泛化能力。未来的研究可以进一步扩大样本量,探索更多优化模型的方法,以推动乳腺癌诊断和治疗技术的不断进步。总之,这项研究为乳腺癌领域的研究开辟了新的方向,具有重要的临床应用价值和科研意义。