编辑推荐:
线粒体形态对研究细胞健康意义重大,但传统评估方法耗时且易有偏差。研究人员开展基于卷积神经网络(CNN)的线粒体形态分类研究,开发出 MitoClass 软件。结果显示该模型分类准确、泛化性强。这为线粒体研究提供高效工具,推动相关领域发展。
在细胞的微观世界里,线粒体就像一个个神秘的能量工厂,不仅承担着能量生产、细胞代谢等关键任务,还在细胞死亡调控中发挥着重要作用。它独特的形态变化,从细长的丝状到高度碎片化的结构,如同细胞健康的晴雨表,反映着细胞的各种生理和病理状态。比如,在许多神经退行性疾病、代谢综合征以及癌症中,都能发现线粒体形态的异常。然而,想要精确地 “读懂” 线粒体形态这本 “健康密码” 并非易事。传统的评估方法依赖人工或半自动技术,不仅耗费大量时间,还容易受到研究人员个人主观因素的影响,导致结果偏差。在追求精准医学和高效科研的当下,开发一种快速、客观且精准的线粒体形态分类方法迫在眉睫。
为了解决这一难题,来自国外的研究人员开展了深入研究。他们聚焦于利用卷积神经网络(Convolutional Neural Network,CNN)技术,开发出一款名为 MitoClass 的深度学习软件,旨在实现线粒体形态的自动分类。经过一系列严谨的实验和分析,研究取得了令人瞩目的成果。该研究成果发表在《Computational Biology and Chemistry》上,为线粒体相关研究领域带来了新的曙光。
在研究过程中,研究人员主要运用了以下关键技术方法:首先,采用基于 MobileNetV2 架构的 CNN 模型进行训练,利用其预训练权重有效提取特征;其次,通过数据增强技术,如旋转、缩放、平移和翻转等操作,扩充训练数据,增强模型的泛化能力;再者,运用转移学习策略,对模型的部分层进行微调,使其更适应线粒体形态分类任务;此外,使用超分辨率显微镜获取高质量图像,并对图像进行预处理,包括裁剪、归一化等操作,为模型训练提供优质数据 。
2. 研究结果
2.1 训练
研究人员选用基于 MobileNetV2 架构构建分类系统。训练时,使用超分辨率结构光照显微镜(SIM)图像,将其分割成仅包含相关线粒体形状的图像块,这些图像块分别对应细长、碎片化或中间形态。为增强模型泛化能力,针对低分辨率图像,通过添加噪声和缩小图像块尺寸模拟成像条件变差的情况,同时运用大量数据增强技术扩充训练样本。在模型构建上,以 MobileNetV2 为骨干网络,利用其在 ImageNet 上的预训练权重提取复杂特征,替换其顶层为自定义层。比如,添加全局平均池化 2D 层、含 32 个神经元且使用 ReLU 激活函数的全连接层(加入 L2 正则化以减轻过拟合)、Dropout 层(失活率 0.4),最后通过含 SoftMax 激活函数的全连接层进行多分类。为解决小且不均衡数据集的训练难题,采用焦点损失函数,让模型更关注难分类样本。最终,模型训练准确率达到 98.70% 。
2.2 模型验证和性能
研究人员使用从多种细胞系、显微镜设置和实验条件下收集的 150 张手动分类的线粒体图像作为验证数据集,评估系统在实际场景中的效率。训练准确率达 98.70%,验证准确率为 95.25%,验证损失为 0.1452,表明模型对未见数据的泛化能力良好。混淆矩阵分析显示,主要类别的真阳性分类率较高,虽因线粒体形态复杂,在相似形状间存在少量误分类,但整体上模型能可靠地将线粒体形态准确分类。
2.3 模型性能评估跨不同细胞系
研究人员在 COS7、HCT、HeLa 和 U2OS 这四种常用细胞系的验证数据集上测试模型的通用性。在 COS7 细胞中,69% 的线粒体网络被分类为中间型,24% 为碎片化,7% 为细长型;HCT 细胞中,72% 为正常,26% 为碎片化,2% 为中间型;HeLa 细胞中,65.33% 为碎片化,33.33% 为中间型,1.33% 为细长型;U2OS 细胞中,48.67% 为正常,44% 为碎片化,7.33% 为中间型 。各细胞系的混淆矩阵结果表明,模型在不同细胞系中均能对线粒体形态进行有效分类,不过在一些形态相似的类别间存在一定混淆,且部分细胞系中因样本量小导致某些类别的识别准确率较低。但总体而言,模型能揭示不同细胞系中线粒体形态分类的细胞类型差异。
2.4 分析 HeLa 细胞线粒体网络的形态变化
为验证模型在识别线粒体形态变化方面的稳健性和可用性,研究人员对 HeLa 细胞进行了两种处理:DRP1 基因敲除(KO)和 CCCP 处理,以诱导线粒体网络发生特定形态变化。DRP1 是线粒体裂变的关键调节因子,其敲除会导致线粒体裂变受损,呈现细长且相互连接的结构;CCCP 作为强效线粒体解偶联剂,会破坏线粒体膜电位,引发广泛的碎片化。研究人员使用每种处理条件下的 150 张图像,通过分类方法评估模型性能。结果显示,在 CCCP 处理的细胞中,97.14% 的线粒体为碎片化,无细长型,仅有 2.86% 的中间型;DRP1 KO 细胞中,50.00% 为细长型,45.33% 为中间型,4.67% 为碎片化;野生型(WT)细胞中,76.35% 为中间型,10.14% 为细长型,13.51% 为碎片化 。这表明模型能有效捕捉不同细胞条件下的线粒体形态变化。
2.5 图形用户界面(GUI)
为提高分类模型的可用性和可及性,研究人员开发了图形用户界面(Graphical User Interface,GUI)。该界面支持加载单个细胞的线粒体网络图像或包含多个细胞的图像数据集进行分类。利用 CellProfiler 自动分离单个细胞并裁剪其线粒体网络,避免重叠或背景结构带来的误差。对于单个图像,GUI 会显示预测的类别(碎片化、中间型或细长型)及相应的置信度得分;对于数据集,会生成汇总直方图,展示不同形态线粒体在数据集中的分布情况。这一界面设计直观,无需编程或机器学习专业知识,方便研究人员和临床医生高效分析线粒体形态。
3. 研究结论和讨论
本研究基于 MobileNetV2 架构的 CNN 开发出 MitoClass 软件,可将线粒体网络形态分为碎片化、中间型和细长型三类。研究结果验证了模型在不同细胞系和实验条件下的稳健性,其泛化能力在处理不同分辨率、噪声水平和实验条件的图像时得到进一步证实。与基于分割的方法相比,该分类模型无需精确的像素级分割,处理速度更快、计算效率更高,对分割误差的鲁棒性更强,适用于高通量应用。然而,该模型也存在一定局限性,如丢失空间和结构信息,无法进行像素级定位,且线粒体网络的异质性会给分类带来不确定性 。但总体而言,MitoClass 软件为研究人员和临床医生分析线粒体网络形态、研究细胞器动力学和健康状况提供了有价值的工具。它能够快速、可靠且高通量地评估线粒体形态,有望显著提高大规模线粒体形态研究的效率和可重复性,推动人们对线粒体健康和疾病的理解迈向新的高度。