3D 卷积神经网络助力腹腔镜手术技能自动评估:开启外科培训新篇章

【字体: 时间:2025年04月20日 来源:Scientific Reports 3.8

编辑推荐:

  为解决腹腔镜手术技能评估缺乏合适数据集、依赖手动标注等问题,研究人员开展基于深度学习的腹腔镜手术技能自动评估研究。利用 3D 卷积神经网络(3DCNN)和新数据集(LSPD),结果显示模型能有效区分新手、学员和专家,这有助于改进外科培训和绩效分析。

  在现代医学领域,腹腔镜手术(Minimally Invasive Surgery,MIS)凭借诸多优势,如术后疼痛减轻、并发症发生率降低、疤痕少、切口小、免疫系统应激小以及恢复快等,成为了外科手术的重要发展方向 。然而,这项技术并非十全十美。有研究发现,在英国和爱尔兰,47% 的外科医生在过去 12 个月的 MIS 手术中出现过失误,美国也有 8.9% 的外科医生在之前 3 个月内犯过重大错误。而且,手术并发症在实习 MIS 外科医生最初的 10 次手术中最为常见,例如 MIS 导致的胆管损伤,不仅使死亡率在一年内增加两倍,仅在美国就造成超过 10 亿美元的损失,且其发生率在过去三十年并未改善,MIS 中的发生率是开放手术的三倍。由此可见,提升腹腔镜手术技能及精准评估的需求迫在眉睫。
传统的 MIS 技能教学和学习多在手术室进行,依赖专家的监督和评估,这是一个耗时的过程。尽管像客观结构化技术技能评估(Objective Structured Assessment of Technical Skills,OSATS)这样的工具被开发出来以减少主观性,但它仍然是一项耗时的手动评估。同时,利用视频进行评估虽有潜力,但缺乏高质量标注数据成为了机器学习模型训练的重大阻碍,手动标注不仅需要专家参与,耗费大量时间和成本,在复杂手术任务中,对精准技能分类也存在困难。此外,现有的开源腹腔镜数据集大多用于检测手术阶段、跟踪解剖结构或识别器械,难以对腹腔镜手术技能水平进行分类。

为了突破这些困境,来自爱尔兰科克大学医学院和健康学院 ASSERT 中心的 David Power 等人开展了一项具有开创性的研究。他们致力于利用深度学习实现腹腔镜手术技能的自动评估,相关成果发表在《Scientific Reports》上。

在研究过程中,研究人员运用了多种关键技术方法。首先,创建了全新的腹腔镜手术性能数据集(Laparoscopic Surgical Performance Dataset,LSPD)。该数据集专门用于评估不同专业水平(新手、学员、专家)的模拟腹腔镜手术技能表现,与现有数据集聚焦不同。其次,采用数据增强技术,对原始数据应用高斯模糊、调整亮度和对比度、添加椒盐噪声以及水平翻转等变换,增加了训练数据集的规模和多样性,防止模型过拟合。最后,构建了 3D 卷积神经网络(3D Convolutional Neural Network,3DCNN)模型,并采用弱监督学习方法,减少了对详细帧级注释的依赖。

下面来看看具体的研究结果:

  • 视频的统计分析:研究人员选择了三个不同难度的技能 ——“bands”(移动橡皮筋到钉子上)、“stack”(堆叠球)和 “tower”(将橡胶三角形对齐成塔),通过记录完成每个技能的时间并制定基本评分系统来量化任务难度。结果发现,专家在完成所有技能时速度更快且得分更高。例如,在 “stack” 技能中,专家的中位完成时间为 3.47 分钟,绩效得分为 8/8,而学员和新手的完成时间和得分均不如专家;“tower” 技能对所有组来说都很困难,但专家的表现仍明显优于学员和新手;“bands” 技能中,专家和学员得分相同,但专家完成速度更快123
  • 3DCNN 分类结果:3DCNN 模型分别作为多类分类器和二元分类器进行测试。作为多类分类器时,模型在预测 “tower” 和 “bands” 技能的表现时,经常误分类且测试准确率较低,“stack” 技能的测试准确率为 79%,相对较高。而作为二元分类器(区分新手和专家)时,模型性能显著提升。“stack” 技能的测试准确率达到 91%,“tower” 技能为 97%,“bands” 技能为 79% 。这表明模型在区分新手和专家方面表现出色456
  • 人类表现和结果:研究还让具有医疗模拟专业知识的人类评估者对技能表现水平进行分类。结果显示,评估者在区分三个组(专家、学员、新手)时比区分两个组(专家、新手)更困难。在 “bands” 技能的分类中,无论是多类还是二元分类,人类评估者都难以区分技能水平。而且,去除学员组后,除 “bands” 技能外,其他技能的分类准确率均显著提高789

综合研究结果,研究人员得出以下结论:利用 3DCNN 模型和 LSPD 数据集,能够在模拟环境中实现腹腔镜手术性能的自动评估。该模型在区分新手和专家进行基本模拟腹腔镜手术技能时,表现出了良好的性能和预测能力,这为外科培训和技能评估提供了新的方向。不过,研究也存在一些局限性,如模型在多类分类问题上预测三种不同技能水平时存在困难,数据集规模较小,学员组技能水平分布较广等。但总体而言,这项研究为后续进一步研究奠定了坚实基础,有望推动腹腔镜手术技能评估向更高效、更精准的方向发展,在未来的外科临床实践和培训中发挥重要作用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号