RIVA:基于多重独立标注的常规巴氏涂片细胞学图像数据集及其在宫颈癌筛查AI模型开发中的价值
《Scientific Data》:RIVA: An Image Dataset of Conventional Pap Smear Cytology with Multiple Independent Annotations
【字体:
大
中
小
】
时间:2025年12月10日
来源:Scientific Data 6.9
编辑推荐:
本刊推荐:为解决宫颈癌筛查中常规涂片缺乏高质量公共数据集的问题,研究人员开展了RIVA数据集构建研究。该数据集包含来自115例患者的959张高分辨率图像及26,158个由四位专家独立完成的标注,涵盖Bethesda系统的八类细胞。其多重标注策略为AI模型训练提供了共识金标准,并首次实现了标注者间一致性定量分析(八类一致性达74%),对推动可解释AI在细胞病理学中的应用具有重要意义。
在全球范围内,宫颈癌依然是威胁女性健康的主要疾病之一,而巴氏涂片(Pap smear)筛查被证明是降低其发病率和死亡率的有效手段。然而,传统的细胞学检查依赖于病理医生在显微镜下人工观察染色后的细胞样本,这个过程不仅耗时费力,更深受人为因素影响——包括个人经验差异、观察者间判断不一致以及在高负荷工作下可能出现的敏感性和可重复性下降等问题。这些局限性严重制约了筛查项目在资源有限地区的普及与公平可及。
近年来,人工智能(AI)尤其是深度学习技术,在医学影像分析领域展现出巨大潜力,甚至在部分任务中达到或超越了专家水平。然而,在细胞病理学领域,AI的应用仍处于相对初级的阶段,临床落地案例稀少。一个核心的瓶颈在于,缺乏大规模、高质量且多样化的数据集来训练鲁棒性强、泛化能力佳的模型。现有的一些公开数据集,如Herlev、SIPaKMeD、CRIC Cervix和APACC,虽各有特色,但普遍存在一些不足:或样本量有限,或未采用国际通用的Bethesda系统(TBS)进行分类,或标注仅由单名或少量专家完成,无法反映实际诊断中存在的差异性,这些都限制了其用于开发临床可靠AI模型的潜力。
为了解决上述问题,由Luciana Bruno通讯领导的研究团队在《Scientific Data》上发表了题为“RIVA: An Image Dataset of Conventional Pap Smear Cytology with Multiple Independent Annotations”的研究,推出了一个全新的、具有多重独立专家标注的常规巴氏涂片细胞学图像数据集——RIVA。
为开展此项研究,研究人员主要应用了以下几项关键技术方法:首先,样本来源于布宜诺斯艾利斯Hospital Bernardino Rivadavia医院病理科的存档涂片,经伦理批准后匿名化处理。其次,使用Grundium Ocus 40扫描仪对涂片特定标记区域进行40倍放大数字化扫描。然后,通过定制化流程从扫描图像中提取1024 x 1024像素的非重叠迷你图像块(mini-patches)。最关键的是,研究邀请了四位专业细胞病理学家,利用Label Studio平台,在互不干扰的情况下对图像中的细胞核进行关键点标注和Bethesda系统分类,确保了标注的独立性。最后,采用MeanShift聚类算法对来自不同专家的相近标注进行聚合,以确定每个细胞的唯一位置和共识标签,并在此基础上进行了深入的标注者间一致性概率模型分析。
RIVA数据集最终包含959张图像块,源自115名患者的涂片。这些图像块共包含15,949个独特细胞,产生了26,158个独立标注。细胞类型涵盖五种(前)癌变类型(SCC, HSIL, ASCH, LSIL, ASCUS)和三种非病变类型(NILM, ENDO, INFL)。所有数据均通过Zenodo和项目专属网站公开,提供了图像、原始标注及聚合后的共识数据。
本研究的一个突出贡献在于首次对细胞病理学图像标注进行了定量的标注者间一致性分析。通过对所有四位专家都标注过的2,156个细胞进行分析,结果显示:在将细胞简单分为病变与非病变两类时,四位专家完全一致的比率高达94%;即使在包含全部八个细分类的完整Bethesda方案下,完全一致率也达到了30%,显著高于随机基线(0.2%)。此外,分歧多发生在形态学相近的类别之间(如INFL与ASCUS,ASCH与HSIL),而形态独特的细胞(如endocervical cells)则表现出最高的一致性。研究人员还构建了概率模型来估算标注的置信度,结果显示在八分类任务中,专家对最可能类别的判断置信度(pmax)不低于0.74,在二分类任务中则高达0.94,充分证明了专家标注的高可靠性。
通过建立的概率模型,将观测到的一致性与理论预期进行比较,量化了每个标注的置信水平。分析表明,RIVA数据集中专家标注具有高度的内在一致性,为基于此数据集训练的AI模型性能评估提供了可靠的人类表现基准。
综上所述,RIVA数据集的发布为宫颈细胞学AI研究领域注入了一股强劲的新动力。其价值不仅在于提供了大量高质量的常规涂片图像,更在于其创新的多重独立标注范式。这种范式首次使得大规模分析细胞病理诊断中的专家一致性成为可能,为理解人类诊断决策的不确定性提供了宝贵数据。同时,它能为AI模型训练提供更为稳健的“金标准”(如通过多数投票或概率加权产生的共识标签),有助于开发出更接近人类专家认知模式、且能感知诊断不确定性的可解释AI工具。尤其对于医疗资源相对匮乏的地区,此类技术有望在未来辅助提升宫颈癌筛查的效率和准确性,促进医疗公平。因此,RIVA数据集不仅是一个资源宝库,更是一个推动细胞病理学AI向更严谨、更可靠方向发展的关键基础设施。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号