基于脑电图(EEG)的精神病学分类方法:运用主题发现技术
《Neuroscience Informatics》:EEG-Based Classification in Psychiatry Using Motif Discovery
【字体:
大
中
小
】
时间:2025年11月16日
来源:Neuroscience Informatics CS11.7
编辑推荐:
EEG信号动态特征分析框架MDF可早期预测抑郁症治疗反应,7天内F1达0.722,优于tsfresh基线,并成功应用于精神分裂症、阿尔茨海默病等精神类疾病分类。
抑郁症是一种全球范围内的常见心理障碍,影响着大量人群。在临床实践中,患者通常需要等待四到六周,直到医生能够评估其对药物治疗的反应。这种延迟不仅增加了患者的痛苦,也带来了额外的经济负担。因此,尽早识别治疗反应具有重要的临床意义。本文提出了一种新颖的模式发现框架(Motif Discovery Framework, MDF),该框架能够从脑电图(EEG)时序数据中提取动态特征,从而区分抑郁症治疗中的响应者和非响应者。MDF能够在治疗开始后的第七天就预测治疗反应,显著缩短了患者的等待时间。此外,该框架在其他精神疾病(如精神分裂症、阿尔茨海默病和痴呆)的分类任务中也表现出良好的泛化能力。整体实验结果表明,MDF在多个基准测试中表现优异,突显了其在临床决策中的潜力,以及其在改善患者生活质量方面的应用前景。
抑郁症(Major Depressive Disorder, MDD)是一种复杂的心理障碍,其特征包括持续的悲伤情绪、兴趣减退、认知功能障碍以及生理症状,如食欲和睡眠紊乱。它与日常生活中的一般情绪变化不同,对个人的生活和社会产生深远影响。据估计,全球约有3.8%的人口患有抑郁症,这意味着大约有2.8亿人受到影响。MDD的治疗通常包括心理治疗和抗抑郁药物。然而,抗抑郁药物的平均有效率在42%到53%之间,表明相当一部分患者可能对药物无反应。由于抗抑郁药物需要时间才能显现效果,患者在治疗期间可能会经历不必要的痛苦和资源浪费。因此,开发一种能够在早期阶段准确预测治疗反应的方法具有重要意义。
脑电图(EEG)是一种经济实惠且广泛使用的临床工具,能够捕捉大脑活动的动态变化。研究表明,EEG信号在抗抑郁药物治疗的第一周内就可能发生显著变化。因此,探索这些变化是否能够预测积极的治疗反应,有助于减少患者的等待时间并提高治疗效率。本文提出的MDF框架,正是基于这一想法,旨在通过提取EEG数据中的动态模式(即“模式”或“motif”)来实现这一目标。这些模式代表了EEG信号中重复出现的特征,能够揭示不同患者群体之间在大脑活动上的差异。
模式发现是时序数据分析中的一种重要技术,其目标是在没有预设模式位置和形状的情况下,识别频繁出现的模式。在EEG研究中,模式可以对应于特定的大脑活动或状态,例如睡眠的不同阶段。检测这些重复出现的模式有助于理解患者群体之间的不同脑行为特征,并且这些模式可以被领域专家直观地可视化和分析。然而,模式发现面临诸多挑战,包括如何处理信号中的噪声、不同尺度和振幅的模式,以及如何在不知道模式长度的情况下进行有效搜索。这些挑战增加了计算复杂性,尤其是在处理高维或大规模数据时。
本文的框架旨在开发一种可靠且可解释的分类器,以区分抑郁症治疗中的响应者和非响应者,同时保持低维的输入表示。为了实现这一目标,我们从抑郁症患者的EEG数据中提取模式,并通过筛选策略选择最具有区分能力的模式。这一过程需要对模式进行排序,以确保其在分类任务中的重要性。为了提高框架的可扩展性,我们考虑了计算效率和分类器在现有精神疾病工作流程中的集成性。最终,我们选择了一种名为k-Motiflets的算法,该算法结合了模式发现的精确性和计算效率,并能够自动确定合适的输入参数。
在模式发现过程中,我们首先通过特定的算法确定模式的长度。为了优化这一过程,我们使用了一种基于“肘部点”的方法,这种方法通过观察模式长度变化时的性能曲线,来识别最优的模式长度。随后,我们使用另一种算法来确定模式的出现次数(k值),并基于此提取候选模式。为了进一步筛选出最有区分力的模式,我们引入了一个“差异分数”(difference score)的计算方法,该方法通过比较模式在不同患者群体中的匹配距离,来衡量其在分类中的重要性。差异分数较高的模式更有可能在某一类中频繁出现,而在另一类中较少出现,因此具有更强的分类能力。
在模式筛选后,我们构建了一个特征矩阵,该矩阵将每位患者表示为一个向量,其中每个元素对应于与特定模式的匹配距离。这一特征矩阵不仅能够捕捉EEG信号的动态特性,还为后续的分类任务提供了结构化的输入。为了进一步减少特征空间并保留最重要的信息,我们使用了递归特征消除(Recursive Feature Elimination, RFE)方法,该方法通过迭代地移除最不重要的特征,直到达到最优的特征数量。最终的特征矩阵被用于训练和评估多个分类模型,包括支持向量机(SVM)、决策树(DT)、随机森林(RF)、逻辑回归(LR)和多层感知机(MLP)。这些模型的性能评估主要基于F1分数,该分数能够有效衡量分类任务中的准确性和召回率。
实验结果表明,MDF在抑郁症数据集上的表现优于基线方法。在alpha、beta和theta频率带中,MDF的平均验证F1分数分别为0.722、0.713和0.647,而基线方法的验证F1分数分别为0.692、0.600和0.554。这意味着MDF在分类任务中具有更高的精度和稳定性。此外,MDF在其他精神疾病数据集(如精神分裂症、阿尔茨海默病和痴呆)上的表现也相当可观,表明该框架具有良好的泛化能力。例如,在精神分裂症数据集中,MDF的验证准确率为0.857,F1得分为0.876;在阿尔茨海默病数据集中,MDF的验证准确率为0.861,F1得分为0.845;而在痴呆数据集中,MDF的验证准确率为0.87,F1得分为0.865。这些结果进一步证明了MDF在精神疾病分类中的潜力。
尽管MDF在多个数据集上表现出色,但其在某些特定情况下的适用性仍需进一步验证。例如,在癫痫数据集中,EEG信号通常包含尖锐、短暂的放电和突然的波形变化,这些特征虽然对癫痫诊断具有重要意义,但其形状、振幅和时间的不一致性使得它们难以作为模式进行提取。因此,MDF在癫痫数据集上的表现略逊于基线方法。这一结果表明,MDF更适合处理那些EEG信号中存在稳定重复模式的精神疾病,而非那些信号中存在剧烈变化的疾病。
本文的主要贡献在于提出了MDF这一新颖的框架,该框架能够从EEG数据中提取动态模式,并在抑郁症治疗的早期阶段预测患者的治疗反应。此外,MDF还能够扩展到其他精神疾病分类任务中,展现出良好的泛化能力。这些发现为精神疾病的早期诊断和个性化治疗提供了新的思路,同时也为临床医生在治疗决策中提供了更多的数据支持。
未来的工作将集中在改进模式发现算法的性能,特别是在处理多维模式和不同频率带时。当前的框架主要关注单一频率带中的模式发现,但实际的EEG信号通常包含多个频率成分。因此,探索多频率带模式的组合可能会进一步提高分类精度。此外,我们还将研究更长的模式,以更好地区分不同的患者群体。同时,我们计划优化模式排序过程,以更有效地识别最具分类能力的模式。最终,我们的目标是将MDF应用于更广泛的临床场景,为精神疾病的诊断和治疗提供更加精准和高效的工具。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号