AI 助力听力诊断:开源手机应用开启新篇

【字体: 时间:2025年04月25日 来源:Scientific Reports 3.8

编辑推荐:

  听力损失问题日益严峻,全球患者众多且诊断治疗困难重重。研究人员开展了开源手机应用用于听力测试结果分析与诊断支持的研究。结果显示该应用效果良好,能辅助诊断,对减轻临床负担、提升诊断准确性意义重大。

  在现代社会,听力作为人类重要的感官功能,对日常生活起着不可或缺的作用。然而,听力损失问题却如同一颗隐藏的 “定时炸弹”,在全球范围内悄然蔓延,严重影响着人们的生活质量。据世界卫生组织(WHO)估计,目前全球超过 15 亿人面临不同程度的听力障碍,预计到 2050 年,这一数字将飙升至 25 亿。听力损失不仅给个人的沟通、社交和认知能力带来极大挑战,还对家庭和社会经济造成沉重负担,全球每年因听力损失诊断和治疗低效,经济损失高达约 1 万亿美元。
面对如此严峻的形势,早期识别和有效管理听力损失显得尤为重要,特别是在儿童群体中,早期检测能显著减少童年听力损失的发生,改善发育结果。而纯音测听(pure tone audiometry)作为评估听力功能的 “黄金标准”,其结果以听力图(audiogram)的形式呈现,能直观反映个体在不同频率下可感知的最低声音强度,为诊断和治疗提供关键依据。但现实却不尽如人意,精确解读听力图,判断听力损失的类型和位置,对经验丰富的临床医生来说都颇具挑战,更不用说全科医生了。这是因为听力图的潜在配置多达数百万种,其多样性导致解读困难重重。

同时,虽然近年来自动化分类听力测试数据取得了一些进展,但现有方法仍存在诸多问题。例如,Crowson 等人开发的 AutoAudio 模型,虽分类准确率高达 97.5%,但训练数据集小,模型结构复杂,对计算资源要求高,难以在移动设备上运行,尤其是在发展中国家的临床环境中应用受限。Kassjanski 等人提出的 Bi-LSTM 模型,虽训练数据集大且准确率超 99%,但无法直接处理图像数据,临床使用时需手动转换数据,极为耗时。

为了突破这些困境,来自波兰格但斯克理工大学电子、电信与信息学院地理信息系(Department of Geoinformatics, Faculty of Electronics, Telecommunications and Informatics, Gdansk University of Technology)、格但斯克医科大学耳鼻喉科(Department of Otolaryngology, Medical University of Gdańsk)以及格但斯克尼古拉?哥白尼医院耳鼻喉科(Department of Otolaryngology, The Nicolaus Copernicus Hospital in Gdańsk, Copernicus Healthcare Entity)的研究人员,开展了一项极具创新性的研究。他们开发了一款适用于安卓操作系统的开源手机应用,旨在利用智能手机技术提高听力图分析效率,辅助诊断听力损失类型。该研究成果发表在《Scientific Reports》上。

在这项研究中,研究人员运用了多种关键技术方法。在听力图扫描阶段,借助谷歌 ML Kit 的 ML Document Scanner 实现扫描功能,并利用预训练的 YOLOv5 模型检测听力图。数字化阶段,采用概率霍夫变换(Probabilistic Hough Transform)检测线条,YOLOv5s 架构识别符号,结合谷歌的机器学习套件文本识别 v2 API 和微调的 YOLOv5s 模型检测标签。分类阶段,运用训练好的 Bi-LSTM 模型对数字化的听力测试结果进行分类,判断听力损失类型。研究数据来源于 9663 名成年受试者的 15046 个听力测试结果,这些受试者在 2010 年至 2022 年间于波兰格但斯克大学临床中心耳鼻喉科诊所接受评估。

下面来看具体的研究结果:

  • 模型性能评估:通过 5 折交叉验证评估模型性能。听力图检测模型表现出色,平均 mAP50达 0.995,精度 0.999,召回率 1.00,mAP50-95为 0.981;符号检测模型 mAP50为 0.984,精度 0.977,召回率 0.978,mAP50-95为 0.646,在复杂场景下识别有困难;标签检测模型 mAP50达 0.994,精度 0.995,召回率 0.998,mAP50-95为 0.669 ,性能优于符号检测模型。
  • 手机应用测试:在摩托罗拉 Moto G82、三星 Galaxy S21 5G 和三星 Galaxy S23 Ultra 三款不同设备上进行测试,涵盖不同光照条件和听力图复杂程度。结果表明,光照条件和设备的图像处理算法对线条识别影响较大,复杂听力图对检测算法挑战更大。但即使存在较多未识别线条需要插值,应用仍能准确分类听力图,证明了其有效性。

研究结论和讨论部分指出,该应用在各类设备上均可靠展示了各模块功能,在复杂场景中,线插值功能虽关键,但系统仍能准确分类听力图。更昂贵的设备在 Hough 线检测系统中表现更好,主要得益于先进的图像处理算法。即使在价格亲民的摩托罗拉 Moto G82 5G 上,应用也表现出色,具备广泛可用性。

从临床应用角度看,该应用简化了听力测试结果分析流程,全科医生可借助它对纯音测听结果进行分类,区分不同类型的听力损失,减少不必要的转诊,减轻专业听力学家的工作量,同时降低诊断过程中的人为错误风险。此外,应用在数据保护方面也做得相当出色,不收集敏感数据,数据仅在设备 RAM 中临时存储,处理过程本地化且隔离网络,在保障患者隐私方面下足了功夫。

当然,这款应用也并非十全十美。它目前只能处理特定类型的电子生成听力图,无法处理手写格式,且仅能分析单耳听力图,不支持双耳合并数据。不过,研究人员已将项目开源,期待吸引更多研究者参与,获取更多样化的听力图数据集,进一步优化 YOLO 模型,拓展应用功能。

总的来说,这项研究开发的开源手机应用为听力损失诊断带来了新的希望和解决方案,在临床实践和听力领域教育中都具有巨大的潜力,有望成为医生们的得力助手,为全球听力健康事业贡献重要力量。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号