
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于超广角眼底图像的智能诊断:构建首个多类型眼内肿瘤AI数据集
【字体: 大 中 小 】 时间:2025年08月31日 来源:Scientific Data 6.9
编辑推荐:
本研究针对眼内肿瘤AI诊断缺乏公开多样化数据集的瓶颈,开发了包含2031张超广角(UWF)眼底图像的综合性数据集,涵盖5种肿瘤类型及正常图像。通过多模型验证,ViT-B算法取得最优性能(AUC 96.87%),为眼内肿瘤的早期筛查提供了可靠工具。
眼内肿瘤是威胁视力甚至生命的重大疾病,其中视网膜母细胞瘤(RB)和脉络膜黑色素瘤(UM)等恶性肿瘤更具致命风险。然而这类疾病早期症状隐匿,患者就诊时往往已出现严重视力损伤。传统诊断依赖经验丰富的眼科专家,但医疗资源分布不均导致早期筛查覆盖率不足。更棘手的是,现有AI诊断研究面临数据匮乏的困境——公开数据集稀少且多为单一病种,严重制约算法开发。这正是Jie Sun团队在《Scientific Data》发表突破性研究的背景所在。
研究团队创新性地采用超广角(UWF)眼底成像技术,其200°视野范围远超传统设备的30-45°,能更全面捕捉周边视网膜病变。从深圳眼科医院收集的2031张图像经过严格质量控制,由三位专家标注为六类:正常及五种肿瘤类型(RB、UM、CH、RCH、CO)。为验证数据价值,团队测试了ResNet50、ResNet101、ConvNeXt-T和ViT-B四种深度学习模型,采用8:1:1分层抽样划分数据集,并实施数据增强防止过拟合。

技术方法关键点包括:使用Optomap Daytona扫描激光检眼镜(SLO)采集图像;三阶段标注流程(两名初级标注员初筛+高级专家复核);采用t-SNE可视化数据分布;模型训练使用交叉熵损失函数和SGD优化器,结合线性预热与余弦退火学习率调度。

研究结果显示,ViT-B模型表现最优:测试集准确率91.46±2.12%,AUC达96.87±1.09%,对难区分肿瘤类型(如CO与UM)仍保持81.37%的敏感性。t-SNE可视化证实ViT-B能更好分离各类别特征,而传统CNN模型在相似肿瘤间存在显著混淆。值得注意的是,模型对RB和正常图像的识别最为精准,这与临床实践中RB典型表现相符。

讨论部分指出,这是首个公开的多类别眼内肿瘤UWF数据集,其临床价值体现在三方面:首先,UWF技术克服传统设备视野局限,尤其适合捕捉周边部肿瘤;其次,包含同一患者不同病程的图像,可支持疾病进展研究;最后,ViT模型展现的优越性能提示视觉Transformer架构在医学图像分析中的潜力。但作者也坦承局限:未纳入肿瘤模拟病变(如脉络膜痣)可能影响模型特异性,未来需融合超声、OCT等多模态数据提升鉴别诊断能力。

这项研究的里程碑意义在于:为眼内肿瘤AI诊断建立了标准化基准数据集,其采用的UWF成像和ViT算法为后续研究指明方向。通过促进算法开发,该成果有望解决医疗资源不均导致的筛查缺口,实现"AI预警-专家确诊"的新型诊疗模式,最终改善患者预后。数据集已开源共享,将加速全球范围内眼肿瘤智能诊断研究的进展。
生物通微信公众号
知名企业招聘