综述:血管内介入自主机器人技术的进展与挑战:一项全面综述
《iScience》:Advancements and challenges in autonomous endovascular interventional robotics: A comprehensive review
【字体:
大
中
小
】
时间:2025年11月30日
来源:iScience 4.1
编辑推荐:
本综述系统梳理了血管内介入机器人系统(EIRSs)在感知、控制、执行三大核心模块的技术瓶颈(如“世界地图”感知局限、数据集稀缺、设备灵活性不足)与前沿解决方案(如多模态传感融合、学习型控制算法、新型驱动机制),并提出了针对EIRSs的自主性分级框架,为迈向更安全、高效、高自主性的下一代机器人介入平台提供了清晰的研发路径与未来展望。
引言
心血管和脑血管疾病(CCVDs)是全球健康的主要挑战。微创血管内介入手术(MIIS)因其创伤小、疼痛轻、恢复快等优点已成为首选治疗方法。然而,传统的MIIS模式存在诸多局限性,如医生暴露于电离辐射、操作依赖医生经验、学习曲线长等。为克服这些缺点,血管内介入机器人系统(EIRSs)应运而生。本文旨在全面回顾EIRSs的研究进展,分析其核心模块面临的挑战,并展望未来发展方向。
挑战
EIRSs主要包含三个构成模块:感知模块、控制模块和执行模块。在传统手动手术中,医生参与整个过程并起决定性作用。主从式介入机器人系统虽实现了执行模块的机械替代,但医生仍在感知和控制模块中扮演重要角色。为实现更高水平的自主性,需要在感知和控制模块中用自主方法替代手动功能。
理想的自主EIRS要求机器人能够实时、连续、全面地感知其血管环境,并准确报告其当前位姿信息。目前,EIRSs几乎完全依赖外部医学成像来感知手术环境,这种对视觉数据的严重依赖带来了关键挑战。
为更好地概念化这些系统级挑战,我们提出一个针对EIRSs的自主性分级方案(表1),该方案与感知-控制-执行的内在架构紧密一致,并捕捉了医生在三个模块中角色的逐步替代。
目前的感知手段主要包括“世界地图感知”和“机器-生物界面感知”。
“世界地图感知”的常见方法是使用外部医疗成像设备对血管系统进行成像,其中最常用的是基于X射线的数字减影血管造影(DSA)。DSA可以提供介入手术的“世界地图”,但仅提供二维图像,缺乏深度信息,并且需要注射造影剂,高剂量使用可能导致严重副作用。虽然计算机断层扫描血管成像(CTA)可以生成术前三维“世界地图”,但注册实时DSA图像与术前CTA数据存在困难,无法捕捉循环系统的动态特性。
为克服“世界地图”问题,电磁(EM)传感和光纤布拉格光栅(FBG)传感等技术被集成到介入机器人系统中,提供三维位姿/形状信息。然而,这些传感器仅捕获介入机器人本身的形状变化信息,并不直接揭示周围的血管解剖结构。
“机器-生物界面感知”被引入以增强机器-生物界面的感知能力。这些传感器通常安装在机器人本体上,例如在远端尖端,以实现与体内环境的直接交互和监测。然而,界面感知存在实时采集差、传感信号解耦不完善等问题。
在传统手动MIIS中,医生的脑扮演控制模块的角色。在主从系统中,控制和执行模块由不同的子系统实现,医生仍需维持精确的手部控制。血液血管是一个动态环境,机器人在运动过程中会与血管壁发生接触和摩擦,导致施加在机器人近端的控制动作与远端响应之间存在非线性关系,难以通过传统控制方法实现器械的高精度控制。
在此背景下,自主系统的发展尤为重要。随着人工智能(AI)的发展,基于学习的方法越来越多地用于解决各种任务。然而,基于学习的方法仍面临挑战,包括数据收集成本高、可解释性有限、训练场景过于简化、数据集小等。
目前,大多数介入机器人的设计与医生使用的传感和操作原理相同。然而,“世界地图”问题的固有局限性在将这种基于导丝的导航原理转移到机器人介入时带来了技术挑战。安装在机器人远端尖端或本体上的传感器难以提供外科医生所能感受到的精确力反馈水平。
研究人员正在开发新型机器人结构和驱动机制。新的驱动策略——如流体驱动、磁驱动和缆线驱动机制——正在被探索以增强灵活性和自由度(DOF)。正在开发刚度可变连续体机制以提高机器人的可导航性,使其能够适应刚度和尺寸变化的管腔。
当前最先进的ERIS技术
基于第二章提出的关键挑战,本章对EIRSs各个模块进行了全面的文献回顾和现状分析。
EIRSs的感知方法可分为世界地图感知和界面感知(图2)。对于世界地图感知,主要限制是传感信息的维度有限。对于界面感知,延迟和信号失真仍然是主要问题。
- •X射线透视:X射线的发现开启了医学成像时代。然而,透视图像仅提供二维表示,缺乏深度信息。CTA通常用于获取术前三维血管数据,但无法完全解决X射线辐射暴露、造影剂毒性或缺席术中三维数据的问题。
- •超声传感:医学超声(US)成像为导管和导丝的视觉跟踪提供了另一种成像方式。与X射线成像相比,US成像具有较高的软组织对比度且相对便宜。然而,US成像通常提供较低的分辨率和较小的视野。
- •磁共振成像(MRI):MRI可作为术前替代X射线透视的方法。MRI提供逐片的三维图像,用于环境分析和建模。MRI提供高分辨率图像和更宽的视野。然而,基于MRI的介入手术面临实际限制。
- •激光散斑对比成像(LSCI):通过收集和分析来自血细胞的激光散射信息实现体内可视化。该技术具有无辐射暴露、硬件紧凑便携、具有高分辨率成像的宽视野以及无创实时可视化等优点。但该技术也有局限性。
- •基于EM的位姿感知:为了克服图像引导机器人跟踪方法只能提供二维信息的局限性,一些研究人员探索了使用能够直接提供三维反馈的传感器。其中,电磁定位传感器是近年来研究中经常报道的一项领先技术(图5)。电磁定位系统通常由四个关键组件组成:磁场发生器(MFG)、EM传感器、传感器接口单元(SIU)和系统控制单元(SCU)。
- •基于FBG的位姿感知:基于FBG的传感是最近引入介入应用的新兴技术(图6)。该技术的核心是嵌有FBG传感器的光纤,用于估计光纤三维形状的变化。
- •基于生物介电特性(BioDP)的位姿感知:一些研究人员提出利用生物介电特性实现介入机器人的实时位置跟踪(图7)。该技术基于生物组织和器官在受到电极产生的电场作用时表现出特定的介电响应。
此外,一些研究人员探索了结合多种传感技术的混合方法以提高跟踪精度和鲁棒性(图8)。
- •近端力传感:介入机器人中的力传感通常根据传感器位置分为近端传感和远端传感(图9B,9D)。近端力传感通常通过专用力传感器或通过电机电流反馈计算力来实现。
- •远端力传感:远端力主要由介入机器人(如导管或导丝)尖端与血管壁的直接接触或碰撞产生。由于沿机器人的摩擦阻力和血液粘度等混杂因素,仅从近端测量值准确推断远端力具有挑战性。
- •血管内超声(IVUS):在界面传感领域,除力传感外,视觉传感技术——如血管内超声(IVUS)(图9A)——也起着至关重要的作用。
- •光学相干断层扫描(OCT):另一种体内成像技术是光学相干断层扫描(OCT)(图9C),它使用位于介入机器人尖端的激光进行旋转扫描。
在传统手动手术中,医生在决策和控制中都扮演核心角色。在主从式EIRS中,医生根据各种传感模式的集成反馈在主端发出运动命令,从端的机器人系统然后执行这些命令以导航到目标部位。
为了实现复杂血管场景中的精确控制,研究人员提出了各种控制算法。早期的主从介入机器人系统采用开环控制算法。为了提高控制精度,逐渐采用闭环控制算法。
比例-积分-微分(PID)控制算法是最常用的闭环控制方法之一(图10)。PID算法因其简单、易于实现和参数可调而受到许多控制任务的青睐。
为了克服传统PID算法的局限性,研究人员探索了自适应控制策略,例如模糊PID算法和滑模控制(SMC)算法。
近年来,随着基于学习技术的发展,利用深度学习和强化学习的各种控制策略已经出现。神经网络模型具有很强的学习能力,可以逼近复杂的非线性函数,对复杂的非线性时变系统有很强的建模能力。
- •模仿学习(IL):模仿学习(图11)通过使介入机器人能够从专家演示中学习导航策略,为训练介入机器人提供了一种有效的方法。
- •深度强化学习(DRL):近年来,DRL(图11)在EIRSs导航领域取得了显著进展。深度Q学习(DQN)及其变体在涉及离散动作空间的导航任务中表现出强大的性能。深度确定性策略梯度(DDPG)算法由于其在线续动作空间中的优异性能而被广泛用于介入机器人导航任务。
最近的研究强调了Transformer架构和大型语言模型(LLMs)在改善血管内机器人导航中感知-决策耦合方面的潜力。
为了对上述多样化的基于学习的策略进行严格、跨方法的性能评估,我们全面比较了代表性研究在核心性能指标上的表现。表2提供了这些研究的综合定量总结。
自适应决策和控制是自主EIRSs的关键部分。为了实现自主机器人系统,需要开发能够匹配甚至超越专家医生能力的神经网络模型。然而,大多数现有平台仍然依赖于主从设计,其中操作员和机器人之间的协同控制固有地限制了系统的自主性。另一种方法是将决策和控制统一到一个端到端的学习模型中,类似于传统手动程序中外科医生的角色(图12)。
模拟环境为生成多样化、高质量数据集提供了一种灵活且可扩展的方法,从而支持自主EIRSs的开发和验证。考虑到保真度和成本,机器人训练模拟器可分为四类:虚拟环境、体模、离体组织和活体动物(图13)。
- •虚拟环境:在虚拟环境中,血管介入机器人和血管解剖结构使用数学和物理原理进行模拟。
- •体模:为了评估介入机器人的性能,研究人员还使用血管体模进行了实验。
- •离体组织和活体动物:为了实现算法和系统在真实手术场景中更好的可转移性,研究人员不断努力更准确地复制临床环境。
尽管真实模拟器具有更高的保真度,但它们受到伦理和安全问题的限制,因此不适合大规模数据生成或算法训练。
操纵导丝和导管穿过血管需要外科医生熟练地协调拇指和食指(图14A)。通常,拇指和食指捏住导丝或导管,轻轻推动近端部分使远端尖端沿血管路径前进。当遇到血管分叉时,外科医生执行协调的摩擦动作——手指彼此上下相对移动——以将预弯曲的导丝尖端转向所需的分支。
基于图14B所示的操作模式,可以推断出至少三个基本动作——夹持、平移和旋转——对于复制外科医生的手动操作是必要的。这些动作对应于血管内工具导航所需的2个自由度(2-DOF):轴向运动和旋转控制。图14C分类了EIRSs中使用的各种驱动机制,特别关注平移和旋转驱动系统。
商业EIRS平台,如CorPath GRX和Magellan系统,结合了这两种基本机制来实现对血管内工具的完全控制。此外,正在探索新的驱动策略以增强机械性能。
介入机器人的设计很大程度上借鉴了传统的导管和导丝操作技术。大多数临床使用的导管和导丝依赖于被动柔性,这意味着它们不能主动转向,而是依赖于预成型的几何形状。外科医生通常推进预成型的导丝并在血管分叉处手动旋转以将其引导至目标血管。这种操作需要大量的专业知识和精细的运动控制。一个关键的设计要求是最小化从近端控制器到远端尖端的驱动路径中的背隙和摩擦,因为这些因素会降低运动传输的保真度。
为了解决这些挑战,开发具有主动可转向尖端的介入机器人变得至关重要。此类机器人可以提高血管通路成功率并减少血管壁与机器人尖端之间的接触力。目前,主要有四种类型的可转向导管(图15):缆线驱动、形状记忆合金驱动、气动或液压驱动以及磁驱动。
- •缆线驱动介入机器人:缆线驱动介入机器人相对简单、成本低且控制精确。这种设计的一个关键优势是能够将导管尖端弯曲超过180°,这对于在迂曲血管中导航特别有益。
- •形状记忆合金介入机器人:基于形状记忆合金(SMA)的介入机器人利用SMA材料的热致变形特性来实现受控弯曲运动。
- •气动或液压驱动介入机器人:气动或液压驱动介入机器人利用空气或流体产生的压力变化来控制机器人的方向。
- •磁控介入机器人:近年来,随着技术的进步,磁驱动(通常称为磁控技术)已成为介入导管机器人领域一种有前途的方法。
除了上述类型外,一种基于同心管原理的介入机器人越来越受到研究人员的关注。
未来展望
实现完全自主将对血管内介入产生变革性影响,显著提高手术的安全性和精确度,同时大幅减少外科医生的工作量。为了实现这一目标,系统必须在多模态传感、智能决策和自适应控制方面达到新的高度。
在机器人传感部分,外部成像(如X射线透视、MRI和US)仍然是构建解剖结构和设备位姿全局视图的临床主流。记录在案的约束仍然存在:辐射和造影剂负担、在曲折解剖结构中的二维投影限制、设备/电磁约束或某些模态中的实时延迟。因此,仅全局上下文不足以在管腔壁进行安全操作。这些约束推动了对腔内传感的兴趣,特别是类IVUS传感器,以提供局部的、血液侧信息,来补充全局的、房间侧视图。
在界面层面,大多数当前系统仍然从驱动机构内部估计远端交互作用。然而,这些信号容易受到摩擦、背隙和轴柔顺性引起的失真影响,这模糊了实际的导管-壁接触力。因此,力解耦变得具有挑战性,触觉反馈保真度受损,人机协作受到影响。当代评论明确区分了内部/远端传感与外部/近端传感,并警告仅靠近端信号可能无法反映血管内实际情况——主张使用新传感器和混合策略。这推动了一种向尖端远端传感的转变,以直接捕获接触力并减少解耦误差。
最近的原型正好体现了这一轨迹。集成在导管尖端的多芯FBG传感器实现了具有毫牛顿级分辨率的三维力测量,并清晰解耦了纵向和横向载荷,说明了在紧凑设计内临床转化的可行性。同时,为心脏消融量身定制的温度补偿FBG远端传感器据报道具有0.01N的分辨率,且结构简单坚固,适合规模化生产,强调了微型、远端、无害的力传感正变得实用。
除了单模态仪器,该领域正朝着多模态传感方向发展,将全局尺度成像(X射线/MRI/US)与局部尺度界面流(IVUS/OCT/远端传感器)融合,为导航和碰撞避免构建更高保真度的世界模型。最近的评论强调人工智能驱动的融合和模拟/融合现实是关键推动因素, precisely because they can integrate heterogeneous intraoperative data sources rather than relying on any single modality. 一项系统性综述强化了决策支持、自动化和多模态成像是融合领域,尽管许多方法仍处于早期阶段,需要临床验证——将多模态传感框定为既必要又及时。
对于完全或高度自主的EIRSs,传感必须覆盖全局血管树上下文和局部设备-组织交互。来自自主导航研究的证据显示,已经存在将跟踪或视觉传感器与学习策略配对的管道,支持了多个数据流在操作上有用的前提。同时,对商业机器人平台的调查记录了机器视觉、人工智能辅助三维重建和实时引导的日益融合——表明临床系统正在逐步拥抱多模态感知。总之,未来的EIRS传感应优先考虑低风险、微型化的远端传感器与内部成像和AI融合相结合,从而提高数据维度和可靠性,同时减少对脆弱近端反馈通道的依赖。
迄今为止,EIRSs在复杂临床场景中的自主决策能力仍然有限。这些系统仍然严重依赖人工操作,大多数自主功能主要是在虚拟或体模环境中演示的,距离在临床实践中实现完全自主还有相当长的路要走。在此背景下,自主决策和自适应控制应被视为一个耦合的管道:决策层指定任务目标和安全/效率约束,而控制层在术中不确定性下将它们转化为精确的运动和力调节。当代的介入机器人仍然主要是主从式,具有双边控制和安全策略,强调了将高级目标传播到可验证的运动/力边界中的需求。
一个实用的第一步是开发紧密复制人类血管系统的虚拟环境。由于血管系统是高度动态和复杂的——由血流和心脏运动塑造——模拟平台应反映足够的解剖复杂性和生理真实性。为了减轻设计负担并支持不同的开发阶段,模拟器可以组织为两种互补类型:(1)用于通用能力的基础模拟器,和(2)用于临床相关场景中高级控制和复杂任务的特定任务模拟器。这种划分反映了外科自主性研究中的实践,其中基于学习的策略(例如,强化学习和模仿学习)在模拟中成熟,然后才暴露在现实世界中。
由于虚拟和真实环境不可避免地存在差异,模型应在临床部署前解决模拟到现实的差距。模拟可以通过域随机化(DR)——跨越感知数据和动力学——融入大量的可变性,以提高泛化能力。而迁移学习机制,如策略蒸馏和元学习,进一步支持对真实术中条件的适应,并减少在分布变化下的脆弱行为。这些策略与血管内机器人中具身智能的更广泛路线图一致,后者强调在模拟/数字孪生环境中的策略学习与真实世界反馈相结合。
虽然端到端学习提供了优势——包括在陌生场景中更快的错误纠正和更强的性能——但由于神经网络的黑箱性质,它存在可解释性有限的问题。一个模块化的端到端框架可以通过暴露可审计的中间产物(例如,计划路径、预测风险和不确定性估计)来提高透明度,保留数据到决策的流程,同时使行动背后的基本原理更容易检查。这与具身智能视角一致,后者在血管内环境中优先考虑可解释的人工智能和人在回路的监督。并行地,通用的生物医学视觉语言模型展示了强大的跨任务能力,并可能为临床审查提供规划原理和任务要点的实用接口,尽管需要进一步的验证。
在这种架构内,未来的介入机器人有望实现更高程度的自主性——独立导航复杂的血管网络,灵活地自适应其形状,并精确跟踪目标病变——目标是最大限度地减少血管壁接触并减少组织损伤。集成的人工智能算法可以通过预测潜在并发症和优化手术路径提供实时分析和决策支持,而自适应控制机制根据术中反馈随着条件演变动态调整行动。尽管如此,当前文献将人工智能的采用描述为早期阶段,具有异构和非标准化数据——强调了在常规自主之前进行前瞻性验证的必要性。最后,标准化接口和工作流程对齐的集成可以简化操作;综述的概述强调集成是复杂的,并将取决于指南、认证、临床医生教育和治理框架,以确保安全性和可靠性。随着经验的积累,系统可以通过前瞻性评估迭代地完善其性能,从而实现更好的决策和更有效的自适应控制——最终实现更高的精度和更高的成功率。
高质量的数据集是EIRSs性能的基础,然而该领域仍然面临公开可访问数据的明显短缺。因此,许多研究独立构建定制环境并收集数据,增加了成本和复杂性,并使研究结果难以跨研究比较。采集、标记和数据质量的变异性进一步混淆了性能评估;多机构异质性和隐私约束也限制了集中管理,推动了联邦或隐私保护学习策略以及更严格的注释标准。因此,建立丰富、多样化和严格管理的公共数据集将为实验研究提供一个共同的实验基础,加强可重复性,并提高报告结果的可比性和可靠性。CathAction(一个用于血管内手术理解的大规模基准,包含超过50万帧带动作/碰撞注释的图像;约2.5万个分割掩码)和Guide3D(
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号