综述:基于智能手机的眼部、皮肤和声音数据应用机器学习进行疾病预测的范围综述

【字体: 时间:2025年06月06日 来源:JMIR AI

编辑推荐:

  这篇综述系统梳理了49项研究,聚焦智能手机采集的眼部、皮肤及声音数据结合机器学习(ML)方法在疾病预测中的应用。通过筛选PubMed和IEEE Xplore数据库,归纳了31个公开数据集和24种ML模型(如随机森林RF、卷积神经网络CNN),覆盖帕金森病、COVID-19、糖尿病视网膜病变等疾病。研究强调智能手机传感器(如麦克风、摄像头)在远程医疗中的潜力,为未来实验设计、数据库选择及算法优化提供参考。

  

背景

智能手机的普及为医疗诊断带来革新机遇。其内置传感器(如摄像头、麦克风、加速度计)可便捷采集健康数据,结合机器学习(ML)方法实现疾病早期预测。医疗领域产生的海量数据为构建ML模型提供了基础,尤其在乳腺癌、心脏病和糖尿病等慢性病诊断中表现突出。通过分析声音、皮肤和眼部特征,智能手机成为低成本、便携式的健康监测工具。

目标

本综述旨在回答三个核心问题:

  1. 现有研究中用于眼、皮肤和声音分析的公开数据库有哪些?
  2. 这些领域常用的ML模型是什么?
  3. 智能手机如何采集相关数据?
    通过分析49项研究,为健康医疗领域的ML应用提供实践指导。

方法

文献检索采用组合关键词策略,覆盖PubMed和IEEE Xplore数据库,筛选出2390篇论文。通过标题和摘要的关键词筛查(如“machine learning”“smartphone”“disease”),最终纳入49项研究。研究按数据来源分为两类:使用公开数据库的实验和自主设计的智能手机实验。

结果

声音研究

  • 数据库:CoughVid(含2.5万咳嗽录音)、mPower(帕金森病语音数据集)等22个数据库被频繁使用。
  • ML模型:随机森林(RF, 18.5%)和支持向量机(SVM, 13.0%)最常用,尤其在帕金森病(12项研究)和COVID-19(4项研究)预测中。例如,mPower数据集通过RF分析患者语音和触屏操作数据,实现疾病严重度评分。
  • 数据采集:智能手机麦克风录制语音(如持续发“aaah”音),或通过定制App(如Ellipsis Health)收集抑郁患者的语音样本。

皮肤研究

  • 数据库:HAM10000(皮肤癌图像)和ImageNet(新生儿黄疸)等4个数据库主导研究。
  • ML模型:CNN占比30%,用于皮肤癌分类。例如,LightGBM算法通过智能手机拍摄的面部图像实现痤疮严重度分级。
  • 数据采集:手机摄像头拍摄皮肤病变照片,部分研究结合智能手表数据(如皮肤温度)提升情绪障碍预测准确率。

眼部研究

  • 数据库:EyePACS和APTOS(糖尿病视网膜病变数据集)等5个数据库为主。
  • ML模型:CNN使用率达41.2%,如AlexNet架构通过手机附加镜头拍摄的视网膜图像筛查糖尿病视网膜病变。
  • 数据采集:智能手机前置摄像头记录婴儿眼球运动视频,用于自闭症早期筛查。

讨论

跨领域应用
智能手机多模态数据(如语音+加速度计)可同时服务于不同疾病预测。例如,帕金森病研究中的语音和步态数据也可用于情绪分析。然而,用户对隐私(如位置、应用使用记录)的担忧需通过透明数据政策缓解。

局限性
部分研究因未明确使用智能手机被排除;新兴ML算法(如Transformer)尚未广泛引入健康领域。

结论

智能手机结合ML在疾病预测中展现出高效性与可及性。RF和CNN分别是声音/皮肤和眼部研究的首选模型,而mPower、HAM10000等数据库为后续研究提供基准。未来需优化传感器精度、扩大数据集多样性,并加强跨学科合作以推动临床转化。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号