磁共振血管造影图像中脑血管半自动标注数据集的构建与验证
《Scientific Data》:Semi-automatic annotation of brain vessels in magnetic resonance angiography images
【字体:
大
中
小
】
时间:2025年12月12日
来源:Scientific Data 6.9
编辑推荐:
本研究针对磁共振血管造影(MRA)图像中脑血管标注数据集稀缺的问题,开发了一个包含100例手动标注的脑MRA图像数据集。研究人员采用Frangi血管滤器进行初步分割,结合3D Slicer手动优化,并由神经血管外科医生审核验证。该数据集聚焦Willis环及关联血管,包含人口统计学元数据,聚类分析显示四种形态学模式,为脑血管形态变异研究、自动化分割算法开发及AI驱动诊断工具进步提供了重要资源。
在远程外科和个性化手术快速发展的今天,人工智能(AI)、机器学习和机器人技术正推动医疗领域革新。然而,不同领域的发展并不均衡——腹腔手术机器人系统已较为成熟,但涉及心脑血管的血管内机器人手术却面临更大挑战。这类系统需要能在高度脆弱的血管系统中执行超复杂操作的AI技术支持,其核心在于基于医学图像(如计算机断层扫描血管成像CTA、磁共振成像MRI和磁共振血管造影MRA)的交互式3D血管模型。
目前,血管内机器人手术系统寥寥无几,其中Lab Enhanced Vascular Simulating Haptic Ai(LevshaAI)系统是唯一专注于机器人血管内神经外科的平台。该系统的个性化智能血管3D模拟器能根据患者医学图像参数生成独特的脑血管模拟,为外科医生提供近乎真实的手术训练环境。然而,血管重建和模拟这些复杂过程高度依赖于初始血管分割的准确性,而当前大多数图像分割方法仍严重依赖专家手动输入,尚未完全自动化。
虽然基于神经网络的方法可应用于此任务,但这些方法需要大量标注数据集。目前,尽管存在多个脑MRA数据集,但它们往往缺乏标注或图像数量不足。脑血管自动标注的缺失不仅是开发个性化医疗和远程外科的重大挑战,也限制了外科医生的实践能力。成功执行脑部手术,尤其是动脉瘤和血管搭桥手术,需要深入了解脑血管的空间分布。目前,外科医生主要依靠对MRA脑图像的视觉分析来评估血管空间分布,但人类无法从2D投影完全感知3D结构,且此过程需要丰富经验。此外,手动标注MRA扫描极为耗时,通常每个扫描需要6-8小时。
现有血管造影数据集,如时间飞跃法MR血管造影(TOF-MRA)和对比增强MRA,虽能无创显示颅内血管系统,但与大型结构/功能MRI资源相比,包含完整血管标注的公开真实脑MRA数据集仍然稀缺。大型多模态MRI数据集(如HCP、CamCAN)在标准发布中不提供MRA,而IXI和ITKTubeTK/UNC集合提供TOF-MRA但缺乏公开的手动血管树标注。DeepVesselNet合成数据集提供全面血管标签,但并非源自真实患者影像。带有完整血管标注的公开真实TOF-MRA数据集仍然有限,尽管存在特定任务标签(如ADAM挑战中的动脉瘤掩模)。标注真实MRA的稀缺性源于手动标记的劳动密集型性质,以及在采用异质协议获取的3D体积中自动化描绘薄壁、分支状管状结构的困难。
在此背景下,研究人员在《Scientific Data》上发表了题为“Semi-automatic annotation of brain vessels in magnetic resonance angiography images”的研究,旨在解决上述挑战。他们开发了一个包含100张手动标注的脑MRA图像的数据集,这些图像源自IXI数据集,是当前公开可用的最大且具有详细血管分割的数据集之一。研究重点关注对神经血管手术规划至关重要的Willis环及相关血管。
为开展研究,作者采用了几个关键技术方法:从公开可用的IXI数据集中选择MRA扫描;通过强度分布直方图和Ward层次聚类对图像进行聚类以促进强度统计的同质性;使用FreeSurfer的mri_synthstrip工具进行颅骨剥离和脑掩模创建;应用Frangi血管滤器进行初步自动分割;利用3D Slicer进行手动标注,并由三名神经血管外科医生监督审核;最后通过信号噪声比(SNR)、对比噪声比(CNR)等多种指标进行技术验证。
数据集在Zenodo平台公开可用,包含IXI-MRA数据集的标注脑血管,文件格式为NIfTI,文件名与IXI数据集的主题ID对应。研究人员还分析了聚类人群的元数据,发现不同聚类在性别、婚姻状况、职业和资格分布上存在差异,为后续研究提供了潜在方向。
技术验证部分量化了数据集的技术质量和标注工作流程的稳健性。研究人员报告了三名独立标注者之间的一致性以及标注者自身的一致性。
评估指标包括Dice相似系数(DSC)、平均对称表面距离(ASSD)和95%豪斯多夫距离(HD95)。标注者间一致性分析显示,三名标注者两两之间的DSC中位数在0.95至0.97之间,ASSD中位数在0.19毫米至0.24毫米之间,HD95中位数在1.65毫米至1.84毫米之间,表明标注者间具有高度一致性。标注者自身重现性评估(间隔两周重新标注)显示,DSC中位数在0.96至0.97之间,ASSD中位数在0.12毫米至0.15毫米之间,HD95中位数在1.39毫米至1.49毫米之间,证明了标注流程的时间稳定性。
此外,研究还通过信噪比(SNR)、对比噪声比(CNR)、变异系数(CV)和边缘对比噪声比(eCNR)对数据集进行了分析。大多数扫描的SNR ≥ 10,CNR显著大于1,表明血管与背景对比良好。CV中位数约为50%,表明噪声显著低于平均信号。约半数eCNR值大于1,表明扫描图像具有中等边缘锐度。尽管整体SNR/CNR良好,但部分容积效应和体素各向异性降低了边界梯度,尤其是在远端血管中,这使得全自动标注具有挑战性。
本研究成功构建并验证了一个高质量的脑MRA血管标注数据集。该数据集通过半自动流程(Frangi滤器初步分割结合3D Slicer手动优化和神经外科医生审核)创建,重点关注Willis环及主要关联血管,保留了血管的拓扑关系和解剖连续性。技术验证证实了标注的高一致性和可重现性,以及图像良好的信噪比和对比度。作为当前最大的公开可用且具有详细血管分割的脑MRA数据集之一,该资源将显著促进自动化分割算法的发展、脑血管形态变异的研究以及AI驱动诊断工具的进步,对推动神经血管手术的个性化和远程化发展具有重要意义。数据集和相关代码均已公开,可供学界广泛使用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号