基于深度学习的脑龄预测模型跨多中心EEG数据集的泛化能力评估
《IEEE Transactions on Biomedical Engineering》:Assessing the robustness of deep learning based brain age prediction models across multiple EEG datasets
【字体:
大
中
小
】
时间:2025年12月04日
来源:IEEE Transactions on Biomedical Engineering 4.5
编辑推荐:
本研究针对脑电图(EEG)数据因采集设备和人群差异导致的模型泛化难题,系统评估了深度学习(DL)模型在跨数据集脑龄预测中的稳健性。通过留一数据集出(LODO)和留一数据集入(LODI)两种交叉验证框架,对1805种超参数配置进行测试,发现使用1-45Hz全频段数据能显著提升模型性能。结果表明,DL模型能够学习到可迁移的年龄相关EEG特征,在年龄分布较广的数据集上表现出强相关性(Pearson's r最高达0.84),为EEG生物标志物的临床转化提供了重要基准。
随着人工智能(AI)在医疗领域的深入应用,脑电图(EEG)因其无创、低成本的优势,成为认知障碍和病理解码的重要工具。然而,EEG数据易受采集设备、电极类型、人群社会经济背景等多种因素影响,导致不同数据集之间存在显著分布偏移。这种数据集偏移会严重削弱深度学习(DL)模型在新数据上的性能,制约其临床推广。特别是在轻度认知障碍(MCI)人群的痴呆风险预测等场景中,标注数据往往仅存在于少数中心,而模型需在多年随访后才能验证其预测效果。因此,评估DL模型在完全未见数据集上的泛化能力,成为推动EEG技术临床落地的关键挑战。
为此,由Thomas Tveitst?l、Mats Tveter等多国学者联合开展的研究,以年龄作为目标变量,系统探索了DL模型在跨数据集EEG数据上的泛化能力。该研究已发表于《IEEE Transactions on Biomedical Engineering》。研究人员收集了五个静息态EEG数据集(TDBRAIN、LEMON、SRM、Miltiadous和Wang),涵盖健康人群、抑郁症、阿尔茨海默病等不同群体,总样本量超过1700例。研究设计了留一数据集出(LODO)和留一数据集入(LODI)两种交叉验证策略,分别模拟多中心联合训练和单中心训练的临床场景。通过对1805种超参数配置的大规模测试,包括深度学习架构(Inception网络、Deep4Net、ShallowFBCSPNet)、频段滤波(δ、θ、α、β、γ及1-45Hz全频段)、域适应方法(域对抗学习、卷积Monge映射归一化CMMN)等变量的系统优化,全面评估了模型在未见数据上的预测性能。
关键技术方法包括:使用MNE-Python和autoreject进行EEG数据预处理(去除前30秒信号、1-45Hz带通滤波、分段为5-10秒时长数据段);采用区域池化(RBP)、球面样条插值或生物物理插值处理不同导联配置;引入样本重加权策略平衡数据集间样本量差异;通过域对抗学习和CMMN减少域间分布偏移;利用随机森林和fANOVA方法量化超参数重要性。
研究发现,模型性能高度依赖于源数据集与目标数据集的配对组合。在LODO设置下,模型在TDBRAIN、LEMON和SRM等年龄分布较广的数据集上表现出较强的相关性(Pearson's r分别为0.63、0.84、0.75),而在年龄范围较窄的Miltiadous和Wang数据集上预测性能显著下降(Pearson's r仅为0.23和0.10)。LODI实验中,性能波动更大(Pearson's r介于-0.11至0.84之间)。值得注意的是,使用目标数据集的平均年龄对模型截距进行校正后,部分R2分数得到显著提升。模型预测结果与真实年龄的散点图显示,在年龄跨度大的数据集上,预测值与真实值呈明显线性趋势,而在小样本数据集上则出现系统性偏差。
通过fANOVA方法对高性能区域的超参数贡献度进行分解发现,频段滤波是影响模型泛化能力的最关键因素。使用1-45Hz全频段数据相比单一频段能显著提升预测性能(图4、图5)。在LODO实验中,频段滤波与DL架构的交互效应为第二重要因素;而在LODI实验中,频段滤波与数据归一化的交互效应更为突出。相比之下,域适应技术(如CMMN和域对抗学习)并未表现出稳定的性能增益,其重要性远低于基础预处理和模型架构选择。
本研究首次在大规模跨数据集框架下验证了DL模型从EEG信号中提取脑龄相关特征的泛化能力。结果表明,尽管模型在年龄分布狭窄或临床人群特异的数据集上表现不佳,但在年龄跨度较大的数据集中展现了稳定的相关性。这一发现为EEG生物标志物的跨中心应用提供了实证支持。研究强调,全频段信息的保留是提升模型鲁棒性的关键,而复杂的域适应技术并未显著优于经验风险最小化基线。此外,研究揭示了在小样本场景下模型选择的高方差问题,提示在低资源数据集中需采用更稳健的评估策略。
研究的局限性包括仅使用静息态闭眼数据,未探索时频域等其他特征表示;数据集中非欧洲人群样本较少,限制了跨人口泛化能力的全面评估;未涉及模型可解释性分析。未来工作可结合多中心临床终点(如痴呆转化),进一步验证EEG生物标志物的临床效用。
总之,该研究通过系统性的基准测试,证明了DL模型能够从EEG中学习可迁移的年龄相关模式,为开发鲁棒的跨数据集EEG分析工具奠定了重要基础。研究成果对推动EEG在认知障碍早期诊断中的临床应用具有积极意义。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号