-
生物通官微
陪你抓住生命科技
跳动的脉搏
人工智能工具创建细胞的“合成”图像,用于增强显微镜分析
【字体: 大 中 小 】 时间:2024年04月24日 来源:AAAS
编辑推荐:
加州大学圣克鲁斯分校的研究人员已经开发出一种方法,使用图像生成人工智能模型来创建单细胞的逼真图像,然后将其用作“合成数据”来训练人工智能模型,以更好地进行单细胞分割。
通过显微镜观察单个细胞可以揭示一系列重要的细胞生物学现象,这些现象经常在人类疾病中发挥作用,但区分单个细胞及其背景的过程非常耗时——这是一项非常适合人工智能辅助的任务。
人工智能模型通过使用一组由人类注释的数据来学习如何执行这些任务,但是将细胞与其背景区分开来的过程,称为“单细胞分割”,既耗时又费力。因此,在人工智能训练集中使用的注释数据数量有限。加州大学圣克鲁斯分校的研究人员已经开发出一种方法来解决这个问题,他们建立了一个显微镜图像生成人工智能模型来创建单细胞的逼真图像,然后将其用作“合成数据”来训练人工智能模型,以更好地进行单细胞分割。
这款新软件发表在《iScience》杂志上的一篇新论文中。该项目由生物分子工程助理教授Ali Shariati和他的研究生Abolfazl Zargari领导。这个名为cGAN-Seg的模型可以在GitHub上免费获得。
“从我们的模型中得到的图像已经准备好用于训练分割模型,”沙里亚蒂说。“从某种意义上说,我们在没有显微镜的情况下进行显微镜观察,因为我们能够在单个细胞的形态细节方面生成非常接近真实细胞图像的图像。它的美妙之处在于,当它们从模型中出来时,它们已经被注释和标记了。这些图像与真实图像有很多相似之处,这使我们能够生成新的场景,而我们的模型在训练过程中没有看到这些场景。”
通过显微镜观察单个细胞的图像可以帮助科学家了解细胞的行为和动态,改善疾病检测,并发现新的药物。亚细胞的细节,如纹理,可以帮助研究人员回答重要的问题,比如一个细胞是否癌变。
然而,从背景中手动查找和标记细胞边界是非常困难的,特别是在图像中有许多细胞的组织样本中。研究人员可能需要几天的时间来手动对100张显微镜图像进行细胞分割。
深度学习可以加速这一过程,但需要一个带注释的图像的初始数据集来训练模型——至少需要数千张图像作为基线来训练准确的深度学习模型。即使研究人员可以找到并注释1000张图像,这些图像也可能不包含在不同实验条件下出现的特征变化。
Zargari说:“你想要展示你的深度学习模型在不同细胞类型和不同图像质量的不同样本中工作。”“例如,如果你用高质量的图像训练你的模型,它将无法分割低质量的细胞图像。我们很少能在显微镜领域找到这么好的数据集。”
为了解决这个问题,研究人员创建了一个图像到图像生成人工智能模型,该模型采用一组有限的带注释的、标记的细胞图像,并生成更多的图像,引入更复杂和不同的亚细胞特征和结构,以创建一组不同的“合成”图像。值得注意的是,它们可以生成具有高密度细胞的注释图像,这些图像特别难以手工注释,并且与研究组织特别相关。该技术可用于处理和生成不同细胞类型以及不同成像方式的图像,例如使用荧光或组织学染色的图像。
扎尔加里领导了生成模型的开发,他使用了一种常用的人工智能算法,称为“循环生成对抗网络”,用于创建逼真的图像。生成模型通过所谓的“增强功能”和“风格注入网络”得到增强,这有助于生成器创建各种高质量的合成图像,显示细胞可能看起来的不同可能性。据研究人员所知,这是首次在这种情况下使用风格注射技术。
然后,由生成器生成的这组不同的合成图像被用来训练一个模型,以准确地对实验期间拍摄的新真实图像进行细胞分割。
“使用有限的数据集,我们可以训练一个很好的生成模型。使用生成模型,我们能够生成更多样化和更大的注释合成图像集。使用生成的合成图像,我们可以训练一个很好的分割模型——这是主要的想法。”
研究人员将他们使用合成训练数据的模型结果与更传统的训练人工智能的方法进行了比较,以跨不同类型的细胞进行细胞分割。他们发现,与传统的、有限的训练数据训练的模型相比,他们的模型产生了显著改善的分割。这向研究人员证实,在分割模型的训练过程中提供更多样化的数据集可以提高性能。
通过这些增强的分割能力,研究人员将能够更好地检测细胞并研究单个细胞之间的变异性,特别是干细胞之间的变异性。在未来,研究人员希望利用他们开发的技术,超越静态图像来生成视频,这可以帮助他们确定影响细胞早期命运的因素,并预测它们的未来。
沙里亚蒂说:“我们正在生成合成图像,这些图像也可以变成延时电影,在那里我们可以生成细胞看不见的未来。”“有了这个,我们想看看我们是否能够预测细胞的未来状态,比如细胞是否会生长、迁移、分化或分裂。”