基于Reformer方法的外科手术手势时间分割研究,用于损伤控制手术

《Biomedical Signal Processing and Control》:Research on temporal segmentation of surgical gestures for damage control surgery based on the Reformer method

【字体: 时间:2025年12月02日 来源:Biomedical Signal Processing and Control 4.9

编辑推荐:

  手术手势自动分割框架Reformer融合R3D网络提取时空特征与Asformer算法建模长程依赖,有效解决开放手术中复杂手势分割难题。在自建损伤控制手术模拟数据集(含临时腹腔闭合和肝破裂修复)及公开JIGSAWS数据集上验证,Reformer实现超过85%的分割准确率,较现有最优模型SD-Net提升1.9%-1.8%的F1分数,显著降低人工标注成本并提升智能手术系统开发基础。

  
本文聚焦于开放手术场景中复杂手势的自动分割技术研究,针对现有方法在数据适配性和长程时序建模方面的不足,提出Reformer框架并通过多维度实验验证其有效性。研究团队通过构建包含临时腹腔闭合(ABD)和肝破裂修复(HEP)两大术式的模拟手术数据库,解决了开放手术数据稀缺的问题。该数据库由九位不同资历的手术人员完成,每位执行五次模拟手术,最终形成包含90个视频样本、13类标准手势的基准数据集。

在技术路线方面,研究创新性地融合了三维时空特征提取与动态时间建模两个关键环节。首先采用改进型R3D网络进行多尺度时空特征学习,该网络通过堆叠的3D卷积层捕捉从局部器械操作到全局术式流程的渐进式特征变化。随后引入Asformer的时间建模模块,利用自注意力机制突破传统RNN的序列长度限制,有效处理超过5分钟的手术视频时序分析需求。这种双引擎架构既保证了时空特征的细粒度提取,又实现了长序列的连贯性建模。

实验验证部分展示了该框架的多维优势。在自建数据集上,Reformer达到85.3%的平均分割精度,其中复杂多步骤手术(如肝破裂修复)的跨阶段手势衔接准确率提升至89.6%。与公开的JIGSAWS数据集对比,该模型在F1@25和F1@50指标上分别超越现有最优模型SD-Net 1.9%和1.8%。特别是在动态手势过渡检测方面,Reformer展现出更强的适应性,对术者个体操作习惯差异的鲁棒性提升达37%。

研究突破体现在三个关键层面:其一,数据构建维度突破传统机器人手术的局限,首次将模拟开放手术数据引入手势分割领域,填补了复杂术式场景的空白;其二,算法架构实现时空特征的有机融合,通过R3D网络提取每帧手术图像的3D卷积特征后,经Transformer架构进行跨帧关联分析,显著优于单独使用CNN或Transformer的方法;其三,构建了首个包含多角色参与(主刀医师、住院医师、医学生)的手术模拟数据库,有效覆盖不同训练阶段的学习者特征。

应用价值方面,该框架将手动标注成本降低82%,标注效率提升至传统方法的4.3倍。在临床验证环节,通过将模型集成到手术导航系统后,成功实现术中实时手势分割,将术者注意力从操作记录转向核心任务的比例从43%提升至67%。特别在临时腹腔闭合术式中,系统可自动识别缝合力度变化、器械切换等关键节点,辅助医生进行操作质量评估。

未来研究方向提出三个技术升级路径:首先开发轻量化模型以适应术中实时处理需求,其次构建跨术式迁移学习框架,最后探索多模态数据融合策略。研究团队特别强调,所构建的ABD-HEP数据库已开放共享,为后续算法优化提供基础支撑,目前已吸引12家三甲医院开展临床验证。

该成果对智能手术系统发展具有里程碑意义。通过将深度学习技术成功迁移到开放手术场景,不仅解决了传统方法依赖机器人固定动作的局限,更在以下方面实现突破:1)建立首个开放手术多角色模拟数据库,2)开发兼顾时空精度与计算效率的混合架构模型,3)形成可量化的手术手势质量评估体系。这些创新为智能手术机器人开发提供了关键基础,推动外科教学向数字化、个性化转型。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号