
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于卷积神经网络的耳内镜手术视频解剖结构分割基准构建与AI预测效能评估
【字体: 大 中 小 】 时间:2025年05月26日 来源:Auris Nasus Larynx 1.6
编辑推荐:
本研究针对耳内镜手术(EES)中关键解剖结构(镫骨、鼓索神经、面神经)的AI识别难题,通过前瞻性采集40例耳内镜鼓室切开术视频构建分割基准数据集,采用卷积神经网络(CNN)中的U-Net模型(EfficientNetB6主干)进行多结构分割,获得总体Dice评分77.94%、灵敏度78.42%、特异度99.79%的效能,为耳科手术AI导航系统开发奠定基础。
在微创外科技术快速发展的今天,耳内镜手术(EES)凭借其优越的视野呈现能力正在重塑耳科手术格局。然而,中耳复杂的"微缩解剖"环境——镫骨(stapes)、鼓索神经(chorda tympani)与面神经(facial nerve)等重要结构常以毫米级间距共存——使得术中精准识别成为巨大挑战。传统计算机视觉依赖的术前-术中图像配准技术在此遭遇瓶颈,因为中耳缺乏明确的标志点进行空间对应。这一技术空白直接制约了人工智能(AI)在耳科手术导航、风险预警等领域的应用。
悉尼某三级转诊中心的研究团队在《Auris Nasus Larynx》发表的研究给出了创新解决方案。通过采集40例耳硬化症镫骨手术的EES视频(60fps),研究者每15帧提取图像构建1379帧训练集,采用开源软件手动标注三大解剖结构建立"基准真值"(ground truth)。基于此,团队测试了多种卷积神经网络(CNN)架构,最终选用具有EfficientNetB6主干的U-Net模型,在300个训练周期后实现对未标记视频的自动分割。
关键技术包括:1)前瞻性视频采集与帧采样策略;2)多专家手动标注建立基准数据集;3)U-Net+EfficientNetB6的深度学习架构优化;4)Dice系数、灵敏度/特异度等多维度评估体系。
【Ground truth dataset】
通过双盲标注验证的1379帧训练数据表明,中耳结构在EES视频中具有稳定的形态学特征,但存在照明条件变化、血液遮挡等干扰因素。
【Results】
测试集416帧数据显示,模型对骨质结构(镫骨)的识别优于神经结构,三者综合Dice评分达77.94%。特异性(99.79%)显著高于灵敏度(78.42%),反映模型更擅长排除非目标区域。
【Discussion】
这项研究首次证明CNN在EES多结构分割中的可行性,其性能媲美早期腹腔镜AI研究(73-85%)。值得注意的是,面神经识别相对欠佳可能与其解剖变异有关,而鼓索神经的纤细特征增加了分割难度。研究者建议后续应扩大数据集并引入时序分析,以提升动态场景下的鲁棒性。
该研究的里程碑意义在于:1)创建首个EES多结构分割基准数据集;2)验证CNN技术在无明确标志点的解剖环境中的适用性;3)为实时手术导航系统开发提供技术储备。随着模型优化,这项技术有望转化为术中预警工具,降低耳科手术中约7.5%的医源性神经损伤风险,同时为手术教学提供智能标注支持。
生物通微信公众号
知名企业招聘