基于虚拟现实与眼动追踪技术的自闭症谱系障碍儿童辅助诊断新方法
《Scientific Reports》:Auxiliary diagnostic method for children with autism spectrum disorder based on virtual reality and eye-tracking technology
【字体:
大
中
小
】
时间:2025年11月19日
来源:Scientific Reports 3.9
编辑推荐:
本研究针对自闭症谱系障碍(ASD)传统诊断方法存在的主观性强、易受经验偏差影响等问题,开发了一种结合虚拟现实(VR)眼动追踪技术的辅助诊断框架。通过构建多尺度搜索增强凝视网络(MSEG-Net)实现3.80°的高精度视线估计,并利用贝叶斯决策模型(BDM)对注视、扫视和平滑追踪三种眼动模式进行分类。在WebVR情绪识别任务中达到85.88%的准确率,为ASD的客观诊断提供了新思路。
在儿童发育行为领域,自闭症谱系障碍(Autism Spectrum Disorder, ASD)是一种常见的神经发育障碍,其核心症状表现为社会交往障碍、沟通障碍以及刻板行为模式。由于ASD症状存在高度异质性和个体差异性,传统诊断主要依赖临床专家观察和标准化评估工具(如DSM-5和M-CHAT问卷),这种方法虽然有效,但容易受到主观判断和临床经验的影响,存在误诊或漏诊的风险。
更棘手的是,ASD儿童在社交互动过程中往往表现出注意力不稳定和情绪易变性等特点,这给行为观察带来了更大挑战。当面对陌生社交刺激时,他们可能在最初三秒内出现眼动频率显著高于正常发育(Typically Developing, TD)儿童的超活跃状态,但随着互动时间延长,这种差异又会逐渐减弱。这种"注意力不稳定性"使得传统诊断方法的可靠性进一步降低。
随着智能医疗技术的发展,基于数据驱动的辅助诊断方法逐渐成为可能。其中,眼动追踪技术因其能够精确记录个体的视觉注意力分配、认知加工和情绪反应等指标,在ASD早期识别和干预中展现出巨大潜力。通过分析ASD儿童的眼动模式,如注视点分布、眼动轨迹和注视持续时间等特征,可以为诊断提供客观量化依据。
然而,传统眼动追踪应用面临诸多挑战:数据准确性受环境因素影响较大,难以在自然场景下获取可靠数据;缺乏多模态信息融合能力,限制了诊断的精确度和可靠性。正是为了解决这些问题,一项发表在《Scientific Reports》上的研究提出了创新性的解决方案——结合虚拟现实(Virtual Reality, VR)和眼动追踪技术的辅助诊断方法。
这项研究通过构建沉浸式VR环境,克服了ASD儿童在社交互动中的注意力不稳定问题,同时利用先进的深度学习算法提升眼动数据的分析精度。研究人员设计了一套完整的辅助诊断框架,包括高精度视线估计、眼动模式分类和VR场景下的行为评估,最终在ASD儿童识别任务中取得了显著成效。
研究方法上,本研究主要采用了几项关键技术:首先开发了多尺度搜索增强凝视网络(Multi-Scale Search Enhanced Gaze Network, MSEG-Net),该网络通过混合卷积(MixConv)和轻量级Transformer架构提取多层次眼动特征,在MPIIGaze数据集上实现了3.80°的视线估计误差;其次利用贝叶斯决策模型(Bayesian Decision Model, BDM)对眼动行为进行分类,区分注视(fixation)、扫视(saccade)和平滑追踪(smooth pursuit)三种模式;最后基于WebVR技术构建虚拟现实实验平台,通过情绪识别任务收集了来自南京儿童医院伦理委员会批准(202111123-1)的ASD儿童和TD儿童的对比数据。
研究提出的MSEG-Net网络采用独特的结构设计,通过搜索块实现多尺度特征提取。该网络包含三个通路:混合卷积通路使用不同尺寸的卷积核提取多尺度特征;残差通路保留输入特征的基本信息;轻量级Transformer通路通过自注意力机制捕捉眼动特征的长期依赖关系。在MPIIGaze、RT-GENE和EYEDIAP三个公开数据集上的实验结果表明,该模型的视线估计误差分别为3.80°、6.28°和4.73°,优于对比的现有方法。
通过贝叶斯决策模型对眼动速度vi和运动比率ri两个特征进行分析,实现了对三种眼动模式的准确区分。该模型利用贝叶斯定理计算后验概率,将眼动行为分类为注视、扫视和平滑追踪。实验结果显示,基于LSTM的分类器在五折交叉验证中达到96.67%的AUC值,显著提高了眼动模式识别的可靠性。
研究构建了基于WebVR的虚拟现实实验平台,包含五个任务模块:静态图像基线测试、虚拟场景自由观察、指令性目标搜索、社交互动注视和多刺激竞争任务。通过对比ASD儿童与TD儿童在虚拟场景中的眼动模式,发现ASD儿童在社交互动任务中表现出明显的注视异常。在Saliency4ASD公开数据集上的实验表明,该方法达到85.88%的分类准确率,而在WebVR环境中的准确率进一步提升至88.88%。
本研究通过系统性的实验验证了结合VR和眼动追踪技术在ASD辅助诊断中的有效性。主要的研究结论和意义体现在以下几个方面:
首先,在技术层面,提出的MSEG-Net网络通过创新的搜索块设计和特征融合策略,显著提升了视线估计的精度。特别是轻量级Transformer模块的应用,在保持较低计算复杂度的同时,有效捕捉了眼动序列的长期时空依赖关系。凝视适应模块(Gaze Adaptation Module, GAM)的引入则解决了多数据集训练中的标注不一致问题,增强了模型的泛化能力。
其次,在方法学层面,贝叶斯决策模型为眼动模式的分类提供了概率学基础。通过建立眼动速度与运动比率的似然函数,并结合先验概率进行推理,该模型能够适应ASD儿童眼动行为的个体差异性,为诊断决策提供可靠依据。
最重要的是,在临床应用层面,WebVR平台的构建实现了诊断场景的生态化效度提升。与传统2D图像范式相比,虚拟现实环境能够更好地模拟真实社交场景,激发ASD儿童的自然注视行为。这不仅提高了诊断的准确性,还降低了设备门槛,使得该技术有望在基层医疗机构推广使用。
研究结果证实,基于虚拟现实眼动追踪的辅助诊断框架能够有效捕捉ASD儿童特有的注视异常模式,如社交场景中的注视回避、面孔注视时间减少等特征。这些客观量化指标为ASD的早期筛查和干预效果评估提供了新工具,有助于减少对主观临床判断的依赖,推动智能医疗工具在发育行为儿科领域的应用。
然而,研究也存在一些局限性。样本规模相对有限,未来需要扩大样本量以验证方法的普适性;虚拟场景的任务设计还可以进一步优化,以更好地激发ASD特征性行为;长期追踪研究将有助于评估该诊断方法对干预效果监测的价值。
总体而言,这项研究为ASD的客观诊断提供了创新性的技术路线,通过多学科交叉的方法解决了临床实践中的关键问题。随着技术的不断完善和临床验证的深入,这种基于虚拟现实和眼动追踪的辅助诊断方法有望成为ASD早期识别和干预的重要工具,为全球ASD儿童的健康管理做出贡献。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号