综述:基于医学数据的牙齿人工智能分割研究综述

《Discover Imaging》:A review of tooth AI segmentation on medical data

【字体: 时间:2025年12月01日 来源:Discover Imaging

编辑推荐:

  本综述系统回顾了2016-2025年间牙齿自动分割领域的研究进展,深入分析了11个主流开源数据集(涵盖CBCT、DPRs、IOS等影像模态)和72项代表性研究。文章详细阐述了U-Net、Mask R-CNN、Vision Transformer及新兴Mamba框架等深度学习架构在二维和三维牙齿分割中的应用,对比了各方法的优劣并总结了Dice、IoU等评估指标。尽管存在数据集异质性和标注标准不统一等挑战,但随着技术标准的完善,自动牙齿分割正逐步成为数字牙科的关键组成部分。

  

引言

在医学影像领域,对精确自动图像分割技术的需求日益增长。牙齿的准确分割对于疾病诊断、治疗计划和临床治疗至关重要。传统牙齿分割技术主要依赖手动或半自动方法,这些方法耗时且难以保证分割准确性。近年来,基于深度学习的自动图像分割方法在牙齿分割任务中得到广泛应用。

背景知识

牙齿分割任务

牙齿分割任务主要包括语义分割和实例分割两种类型。
语义分割又称二元分割,将图像分为牙齿和非牙齿区域。虽然相对简单,但语义分割的临床实用性有限,特别是在牙间间隙狭窄或牙齿接触紧密的情况下,无法准确描绘单个牙齿。其实例分割则为每个牙齿分配不同的标签,通常采用跨两个或多个阶段集成检测和分割过程的网络架构。

开源数据集

口腔医学影像通常分为口内成像和口外成像两类。口内成像技术包括根尖周X线片、咬翼片和口腔内扫描(IOS);口外成像包括锥形束计算机断层扫描(CBCT)、头影测量片和全景放射影像(DPRs)。
本研究共纳入12个开源数据集,涵盖6个DPRs数据集、4个CBCT数据集、1个IOS数据集和1个头影测量片数据集。

评估指标

深度学习中的评估指标可分为三类:基于重叠的指标(Dice相似系数、Jaccard相似系数等)、基于距离的指标(平均对称表面距离、豪斯多夫距离等)和基于体积的指标(相对体积差异、体积误差等)。其中Dice系数因其对较小目标区域的高度敏感性而成为牙齿分割研究中的首选评估指标。

基于数学的传统牙齿分割方法

虽然深度学习技术已成为牙齿分割的主流方法,但基于数学的传统方法在特定背景下仍具有重要价值。特别是在数据资源有限、样本量小或标注数据不足的情况下,传统方法可以有效地作为预处理步骤或补充分割技术。
阈值分割方法通过定义适当的灰度阈值来分割牙齿(前景)和背景区域。区域分割方法通过识别感兴趣区域来实现图像分割,主要利用区域生长和区域分裂合并等策略。边界分割方法主要依赖于利用图像灰度变化的边缘检测技术。

材料与方法

本研究检索了PubMed、IEEE Xplore和Web of Science数据库,使用关键词"teeth segmentation"或"tooth segmentation"进行检索。通过CiteSpace软件对973篇文献进行文献计量分析,生成关键词共现图和时间线图,展示了该领域的研究热点和演变趋势。
最终保留72篇高质量研究,分为三类:14篇基础网络架构研究、23篇二维牙齿分割方法研究和35篇三维牙齿分割方法研究。

基于深度学习的牙齿分割方法

基础网络架构

U-Net引入了一种具有独特U形网络结构的编码器-解码器架构,即使在训练数据有限的情况下也能实现高精度分割性能。
Mask R-CNN在Faster R-CNN的基础上增加了专门用于预测分割掩码的全卷积网络分支,从而促进了对象分类和边界框回归任务的并发处理。Vision Transformer(ViT)是第一个直接将传统Transformer结构应用于图像相关任务的方法,它采用多头注意力机制有效捕获全局上下文信息。

二维分割方法

基于U-Net的二维分割方法

Zhao等提出基于U-Net的两阶段注意力分割网络(TSASNet),在LNDb数据集上实现了92.72%的Dice系数。Hou等将压缩激励模块集成到U-Net架构中,在包含1500张全景X射线图像的多类牙齿分割数据集上实现了94.28%的Dice系数。

基于Mask R-CNN的二维分割方法

Silva等系统比较了Mask R-CNN、HTC、PANet和ResNeSt四种分割架构在LNDb数据集上的性能,结果表明Mask R-CNN提供了最优性能,实例分割的平均准确率达到96.2±0.1%。

基于其他架构的二维分割方法

Chen等使用ResNet50作为特征提取骨干,结合多尺度特征聚合模块、位置感知模块和混合损失函数,在LNDb数据集上实现了93.01%的Dice系数。Kanwal等提出双路径Mask-Transformer网络架构,在LNDb数据集上实现了97.25%的分割准确率。

三维分割方法

基于编码器-解码器CNN的三维分割方法

Zhong等提出基于U-Net框架的轻量级分割架构PMFSNet,在公开的多中心CBCT数据集上实现了91.30%的Dice系数。Isensee等使用改进的nnU-Net架构在ToothFairy2数据集上进行训练,语义分割任务的Dice系数达到92.53%。

基于多阶段CNN的三维分割方法

Wu等引入分层两阶段深度CNN架构,结合边界感知Dice损失函数和图割优化技术,在包含20名患者的CBCT数据集上实现了96.2%的Dice系数。Cui等开发基于V-Net的分层两阶段分割方法,在多中心CBCT数据集上实现了94.1%的Dice系数。

基于注意力机制的神经网络三维分割方法

Liu等开发了用于基于深度学习的牙齿多模态分割的自动多模态融合框架,包括CBCT分割模块、IOS分割模块和多模态融合模块。

基于状态空间模型的神经网络三维分割方法

Hao等引入T-Mamba网络架构,开创性地将频域特征集成到Mamba模型中,在公开的多中心CBCT数据集上实现了93.60%的Dice系数。

结论与展望

尽管基于深度学习的牙齿分割方法取得了显著进展,但仍面临几个挑战:当前牙齿数据集在图像采集和标注质量方面缺乏标准化标准;网络输入数据模态通常单一;随着对数据隐私保护的日益重视,联邦学习将在促进多机构协作方面发挥关键作用。
未来研究应着重于增强模型的泛化能力,标准化数据集采集协议和质量控制措施,并研究更高效、更稳健的网络架构。这些进展将显著促进数字牙科技术在临床诊断和治疗实践中的更广泛应用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号