
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于CNN与Transformer融合模型的阿尔茨海默病早期进展阶段智能检测
【字体: 大 中 小 】 时间:2025年05月15日 来源:Scientific Reports 3.8
编辑推荐:
本研究针对阿尔茨海默病(AD)人工诊断误差率高的问题,提出了一种结合ResNet101、GoogLeNet与Vision Transformer(ViT)的混合模型。通过自适应中值滤波(AMF)和拉普拉斯滤波增强MRI图像特征,利用CNN提取局部深层特征,ViT捕捉全局关联性,最终实现AD四阶段分类准确率达98.7%,AUC达95.05%。该研究为AD早期精准诊断提供了创新性AI解决方案。
阿尔茨海默病(AD)作为进行性神经退行性疾病,全球患者数量预计2050年将翻倍。目前临床诊断依赖MRI、PET等影像技术,但存在主观性强、早期识别率低等问题。传统CNN模型虽能提取局部特征,却难以捕捉长程依赖关系;而纯Transformer模型计算成本高且空间分辨率不足。如何整合两种技术的优势,成为提升AD诊断精度的关键挑战。
沙特阿拉伯国王大学Hassan Almalki团队在《Scientific Reports》发表研究,提出ResNet101-ViT和GoogLeNet-ViT混合架构。研究采用OASIS数据集的86,437张MRI图像,通过AMF去噪和拉普拉斯滤波增强边缘特征,改进CNN结构降低计算量,优化ViT的编码器块和注意力头配置。关键技术创新包括:1) 双模态图像预处理;2) CNN特征图分块嵌入ViT;3) 正弦位置编码保留空间关系;4) 六层Transformer编码器与多头注意力机制。
增强OASIS数据集
采用7×7自适应中值滤波动态去噪,结合拉普拉斯二阶微分算子强化软组织边界,显著提升海马体萎缩等细微病理特征的可见性。
数据扩增策略
对轻度/中度痴呆类分别实施3倍和25倍旋转翻转扩增,平衡四类样本量(非痴呆类9600张,极轻度类8784张),有效缓解类别偏差。
改进ResNet101架构
缩减卷积块至5层(Conv5_x保留512×2048通道),全局平均池化输出2048维特征向量,参数量优化至648万,较原模型降低85.4%。
ViT模型优化
将2048维特征拆分为32个64维子图,通过线性投影生成token。采用6编码器块(原12块)配16注意力头,注意力得分计算引入√dk缩放因子稳定训练,MLP层扩展至256维中间层。
性能验证
五折交叉验证显示,ResNet101-ViT在测试集(20%数据)达到:
讨论与意义
该研究首次实现CNN深度特征与ViT全局建模的有机融合:1) ResNet101残差连接有效缓解梯度消失,保障了海马体等微小结构的特征提取质量;2) ViT的multi-head attention机制成功建模脑区功能连接异常,对早期β-淀粉样蛋白沉积的敏感度提升37.6%;3) 计算效率优化使推理速度提升2.3倍。相比现有技术(如Khan的FME-Residual-HSCMT模型94.52%准确率),本方法将AD进展阶段识别误差率降低至1.3%,为临床前干预提供关键时间窗。未来可扩展至帕金森病等多模态神经影像分析领域。
生物通微信公众号
知名企业招聘