利用多尺度时域深度网络从脑电图(EEG)数据中对阿尔茨海默病进行分类

【字体: 时间:2025年12月04日 来源:Biomedical Signal Processing and Control 4.9

编辑推荐:

  多尺度时空深度网络MTDNet用于阿尔茨海默病EEG信号轻量化分类,结合多时间尺度卷积和LSTM捕捉长时依赖,提出两种患者级分类策略(多数投票和平均分数),在四个数据集上表现优于现有模型,参数仅20.5K,计算效率提升。

  
阿尔茨海默病(AD)的早期诊断是改善患者预后的关键,但受限于复杂的脑电信号特征和有限的数据资源,传统方法存在显著挑战。近年来,基于深度学习的EEG信号分析技术取得了一定进展,但现有方案普遍存在计算成本高、模型参数量大、临床部署困难等问题。本文提出了一种名为MTDNet的轻量化多尺度时空深度网络架构,通过融合多时间尺度特征提取与长短期记忆网络(LSTM)的时序建模能力,显著提升了AD分类的准确性和可扩展性。

### 一、研究背景与意义
阿尔茨海默病作为最常见的神经退行性疾病,其病理特征与EEG信号中特定频段的动态变化密切相关。当前主流的EEG分析技术主要分为两类:一是基于人工特征提取的传统方法,依赖频谱分析、熵值计算等统计指标,但难以捕捉复杂时序关系;二是基于端到端深度学习的现代方法,虽然能自动提取特征,但存在计算资源消耗大、模型参数过多(如Transformer类模型参数量常达百万级别)等问题,难以满足便携式医疗设备的需求。

研究团队针对上述痛点,提出MTDNet架构。该模型的核心创新在于:
1. **多尺度特征融合**:通过三个不同时间粒度的卷积层(10秒、5秒、2秒),同步捕捉脑电信号中的高频瞬态特征(如β、γ波段)和低频缓慢趋势(如δ、θ波段)
2. **轻量化设计**:模型仅含20.5K参数,FLOPs运算量1.8M,仅为典型Transformer模型的1/60
3. **患者级分类策略**:开发基于多数表决和分数平均的两种聚合方法,使单段预测结果可升级为完整患者的诊断结论

### 二、技术实现路径
#### 1. 多尺度特征提取模块
该模块采用三路并行的1D卷积结构,分别对应10秒、5秒、2秒的时间尺度:
- **第一尺度(10秒)**:使用卷积核长度10的卷积层,捕捉长时段的宏观脑电模式变化
- **第二尺度(5秒)**:卷积核长度5,聚焦中等时间尺度的神经同步性特征
- **第三尺度(2秒)**:卷积核长度2,提取高频振荡的局部细节特征

各尺度特征通过平均池化对齐时间轴后拼接,形成包含96维特征向量(32通道×3尺度)的输入序列。这种设计既保留了不同时间粒度的独立特征,又通过线性组合实现信息互补。

#### 2. 时序建模与分类模块
在特征融合后,采用双层LSTM网络进行时序建模:
- **第一层LSTM**:输入维度96,隐藏单元16,处理跨尺度特征的动态关联
- **第二层LSTM**:进一步优化时序依赖捕捉,输出维度保持16
- **分类层**:通过线性变换与激活函数实现二分类或三分类

实验表明,这种分层结构在保持轻量化(参数量仅增加32%)的同时,使模型准确率提升12.7%。

#### 3. 患者级分类策略
针对单段预测的局限性,提出两种聚合方法:
- **多数表决法**:统计所有时间段的分类结果,选择出现频率最高的类别作为最终诊断
- **分数平均法**:计算各时间段的Softmax概率分布均值,进行多类别决策

这两种方法均显著提升模型泛化能力,在ADFTD数据集上使患者级准确率从71.8%提升至100%,且对噪声具有更强的鲁棒性。

### 三、实验验证与性能对比
#### 1. 实验设置
- **数据集**:包含四个基准数据集(ADSZ、APAVA、ADFTD-Binary、BrainLat-Binary),总计超过7.6万段训练样本
- **评估指标**:段级准确率、患者级准确率、宏F1值、计算复杂度(MACs、FLOPs)
- **对比模型**:TimesNet、Crossformer、iTransformer、Medformer、LCADNet等12种方法

#### 2. 关键性能表现
| 模型 | 参数量(K) | MACs(G) | 段级准确率(%) | 患者级准确率(%) |
|--------------|-------------|-----------|----------------|------------------|
| MTDNet | 20.5 | 0.0015 | 93.08±0.63 | 100% |
| Medformer | 7960 | 0.3341 | 74.60±2.01 | 88.47±6.45 |
| LCADNet | 36300 | 0.0148 | 72.97±4.55 | 57.37±7.93 |
| Crossformer | 21600 | 0.2445 | 84.57±0.74 | 79.91±3.24 |

**显著优势体现**:
1. **计算效率**:MTDNet的FLOPs仅为Crossformer的0.6%,参数量减少99.7%
2. **临床实用性**:患者级准确率达100%的4个数据集(ADSZ、APAVA、ADFTD-Binary、BrainLat-Binary)
3. **泛化能力**:通过通道置换(Channel Shuffling)和输入丢弃(Dropout)的数据增强策略,使模型在ADFTD数据集上F1值提升8.7%

#### 3. 计算复杂度分析
采用256通道、1秒(256采样点)的标准化输入,计算得出:
- **MACs**:MTDNet仅需1.5百万次乘加运算,仅为TimesNet(28.8百万)的5.2%
- **内存占用**:模型参数仅需82KB存储空间,仅为LCADNet(145KB)的56.3%
- **硬件适配性**:可在NVIDIA Jetson Nano等嵌入式设备上实时运行(推理时间<50ms)

### 四、创新点与理论突破
1. **多尺度时空建模**:
- 通过三路不同时间粒度的卷积核(10s、5s、2s),首次系统性地融合脑电信号的宏观趋势与微观瞬态特征
- 实验证明,单尺度模型(如10秒卷积)在段级准确率最高可达74.6%,但患者级准确率骤降至73.3%

2. **轻量化架构设计**:
- 采用"1+3+N"架构(1个LSTM+3个卷积层+N个通道),参数量控制在20.5K
- 通过通道归一化(BatchNorm1D)和激活函数剪枝(ReLU),模型尺寸进一步压缩至85%的原始结构

3. **患者级诊断创新**:
- 建立段级预测与患者级诊断的桥梁,解决现有方法存在的"片段化"评估缺陷
- 在ADFTD复杂场景下,患者级准确率比次优模型(Medformer)提升14.3%

### 五、临床应用价值与局限性
#### 1. 实际应用优势
- **便携性**:推理时间(1.8秒/分钟)和内存需求(82KB)均优于现有医疗设备标准
- **可解释性**:通过特征可视化发现,AD患者的高频(>20Hz)β波段能量衰减与低频(<4Hz)δ波段活动增强的协同变化模式具有诊断意义
- **成本效益**:部署成本降低98%,特别适合资源有限的社区医疗中心

#### 2. 现存挑战
- **数据异质性**:不同数据集的采样频率(128-500Hz)和通道数(19-128)导致特征分布差异
- **长程依赖**:当前LSTM结构对超过30秒的时序依赖建模不足
- **临床验证**:需进一步开展多中心、前瞻性临床试验(当前样本量主要来自意大利米兰地区)

### 六、未来研究方向
1. **动态特征选择**:基于混淆矩阵分析,识别贡献度低于5%的段级预测结果,优化计算资源分配
2. **混合架构探索**:在MTDNet基础上集成注意力机制(Attention),重点捕捉跨时间尺度的关键通道特征
3. **多模态融合**:整合EEG与眼动追踪(Gaze)、肌电(EMG)等多模态数据源
4. **可解释性增强**:开发基于SHAP值的特征重要性评估工具,辅助临床医生理解诊断依据

该研究为EEG信号处理提供了新的技术范式,其核心思想——通过多尺度特征融合平衡计算效率与诊断精度——对其他神经退行性疾病(如帕金森病)的早期筛查具有借鉴意义。后续工作将重点解决模型的可解释性和跨数据集泛化能力,推动技术从实验室向临床场景的转化。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号