告别繁琐的茎秆计数:基于人工智能的计算机视觉技术能够在像素级别实现对实心和空心苜蓿茎秆的识别与量化

《Smart Energy》:No More Laborious Stem Counting: AI-powered Computer Vision Enables Identification and Quantification of Solid and Hollow Alfalfa Stems at the Pixel Level

【字体: 时间:2025年08月07日 来源:Smart Energy 5

编辑推荐:

  本研究提出一种基于YOLOv8n模型的AI图像分析 pipeline,结合Otsu阈值法和K-means聚类,高效客观地量化苜蓿茎部形态特征,如空心率。实验表明模型检测F1分数达0.91,可替代人工测量,并支持基因组关联研究和移动端实时分析。

  本研究探讨了一种利用人工智能和计算机视觉技术对苜蓿茎形态进行自动表型分析的新方法。传统的苜蓿茎表型分析通常依赖于人工操作,不仅耗时费力,而且容易受到主观评分的影响。而现代计算机视觉和机器学习技术为这一领域带来了更高效、更客观的解决方案。本文提出了一种基于YOLOv8n模型的图像分析流程,结合Otsu阈值分割和K-means聚类方法,用于识别茎的内外多边形中心,从而通过像素级别的形态学掩膜量化茎的特征。这一方法在检测和分类空心或实心茎方面取得了0.91的F1分数,显示出较高的准确性和效率。通过这一方法,研究者能够更精确地测量茎的面积以及茎组织与空腔区域的比例,生成如空心度评分和空心度百分比等新的表型指标。这些表型数据不仅为后续的化学可消化性分析提供了支持,还使得在田间环境下的实时图像可消化性评估成为可能。

苜蓿(Medicago sativa L.)作为美国第四大作物,其营养价值、蛋白质含量以及可消化纤维含量都备受关注。在美国的牛肉和奶业中,苜蓿及其衍生饲料起着至关重要的作用,因此减少成熟茎中的木质素含量,即使只有1%的降低,也可能显著提高动物的消化能量摄入和体重增长。理论上,苜蓿茎的形态特征,如空心度、形状和大小,对收获材料的可消化性和相对饲料价值(RFV)有影响。因此,开发一种高效、准确的表型分析方法对于未来的植物育种工作至关重要,特别是在通过目标性选择减少木质素含量的育种过程中。然而,目前对茎特征的表型分析仍然主要依赖于视觉评分,缺乏精确性和一致性。

随着植物科学研究的发展,计算机视觉和人工智能驱动的模型正成为一种新兴的趋势。这些技术不仅能够减少人为错误,还能显著加快数据采集和分析的速度,且在不同场景下表现得更加一致。在植物科学中,这些统计算法和模型通常用于学习数据中的模式,从而对新的图像数据进行检测、分类、量化和预测。人工智能模型的强项在于其自动化和可重复性,可以以人类无法达到的速度(毫秒级)准确地识别图像内容。此外,AI模型还能揭示数据中的复杂模式,这些模式在人类视觉下往往难以察觉。

本研究的创新之处在于结合YOLOv8n模型与传统的图像处理方法,开发了一种新的图像分析流程。该流程首先通过YOLOv8n模型对图像中的茎进行检测和分类,随后利用Otsu阈值分割和K-means聚类技术进一步分割茎的组织和空腔区域。这一方法能够在不依赖大量手动标注数据的情况下,高效地获取表型信息,为后续的化学分析提供支持。同时,这种方法还支持开发一个适用于田间使用的移动应用程序,使得研究人员和农民可以实时采集和分析作物数据,如产量、成熟度、RFV、可消化性、病虫害等。

在实验设计方面,本研究选择了1,502个后代,来自五个实验群体(每个群体100个品系,每个品系有三个重复),在明尼苏达大学圣保罗实验站种植。这些植物是更大范围的全基因组关联研究(GWAS)的一部分,旨在通过选择性育种和基因图谱开发具有高或低茎可消化性的种质资源。种子苗于2021年5月26日从温室移栽,并在生长季节的秋季(9月)被剪至3英寸高度。整个研究过程中,通过破坏性采样获取了生物量、生理和化学数据,包括在早期花蕾、晚期开花和绿色豆荚三个成熟阶段采集的样本。本研究中使用的茎图像样本是在2023年6月6日,即第一季收获时,采集的早期花蕾成熟阶段的样本。

图像采集和现场工作流程方面,研究者通过将每个样本区(每个区包含三株植物)切割至一英寸高度,然后将三株植物捆扎放入V形沟槽中,以获得茎横截面的图像数据。图像采集使用了固定距离的24百万像素RGB数码单反相机(Canon Rebel T7),并且每个茎横截面图像都附有标签信息或条形码,以便通过计算机视觉技术提取样本的标签信息。图像采集后,样本被装袋、干燥,并用于后续的干重分析和饲料质量评估。图像采集和处理的流程包括将大尺寸图像分割为多个小块(每个图像被分割为20个1200×1200像素的图像块),以确保在训练模型时图像分辨率不会受到影响。这种方法不仅增加了样本数量,还避免了图像增强过程中常见的衍生数据问题,同时保持了图像的分辨率和背景信息。

在图像标注过程中,研究者从1,502张图像中随机选择了250张用于训练和验证YOLOv8n模型。每张图像中包含来自同一苜蓿基因型或品系的三株植物的茎横截面,且标注信息包括茎的类型(空心或实心)以及它们的数量和形状等信息。这些标注数据被三个专家标注员使用LabelMe软件进行处理,该软件是一种基于网络的图像标注工具,允许用户在图像中进行对象标注及其空间范围。标注后的数据被保存为JSON文件,用于训练和测试YOLOv8n模型。通过这种方式,研究者能够确保模型在不同环境和条件下的泛化能力。

在分析流程中,YOLOv8n模型被用于检测和分类茎,随后通过Otsu阈值分割和K-means聚类方法进一步处理图像数据。YOLOv8n模型因其较小的参数数量(320万)和较快的训练速度而被选为本研究的首选模型。此外,该模型在检测小型对象方面表现出色,非常适合用于检测苜蓿茎横截面及其基于形态学的子类和组织。研究者还使用了K-means聚类方法,通过识别图像中不同区域的颜色强度,将图像分割为不同的区域。K-means算法的参数k被确定为5,这使得模型能够更准确地识别茎的空腔区域。通过这些步骤,研究者能够计算出空心度评分,即空腔区域的像素数占茎总面积的百分比,以及包括茎直径、圆形度等在内的其他形态学指标。

YOLOv8n模型在检测和分类空心和实心茎方面表现出较高的准确率。研究者发现,该模型在检测空心茎时的精确度约为93%,而在实心茎的检测中精确度为87%。这表明模型在空心茎的识别上表现优异,但在实心茎的识别上存在一定的误差。F1分数作为精确度和召回率的调和平均值,对于空心茎和实心茎分别为0.91和0.78,说明尽管实心茎的样本数量较少,模型在整体表现上仍然具有较高的准确率。然而,研究者也指出,由于空心茎和实心茎在样本中的数量不平衡,模型在实心茎的识别上可能存在一定的误差。

在结果部分,研究者分析了不同水平的茎横截面形态数据,包括图像标注、YOLOv8n模型的茎计数和分类结果,以及空心度评分。研究发现,空心茎占总样本的约66.1%,而实心茎占约33.9%。这表明在样本中,空心茎的数量远多于实心茎。通过图像分析,研究者计算出空心度评分,并发现空心度评分与茎的横截面空腔区域的像素数密切相关。此外,研究者还分析了不同茎类别的空心度评分与样本数量之间的关系,发现空心茎类别的平均空心度评分较高,而实心茎类别的平均空心度评分较低。

在讨论部分,研究者指出,本研究的主要目标是测试其提出的对象检测和分割流程是否能够替代当前的人工茎采样方法,并提高田间收集的茎表型数据的数量和分辨率。研究结果表明,该方法在准确性和效率方面均优于传统的人工方法。然而,研究者也指出了该方法在实际应用中可能面临的挑战和局限性。例如,YOLOv8n模型在实心茎的检测中存在一定的误差,这可能与样本数量不平衡有关。此外,由于模型未显式训练背景数据,某些背景误判可能影响其对茎的识别能力。研究者还提到,通过优化模型参数和改进图像采集条件,可以进一步提高模型的性能。

未来的研究方向包括扩展该方法的应用范围,例如通过结合点云数据和高光谱图像数据,进一步提高空心度评分的准确性。此外,研究者还计划开发一个适用于田间使用的移动应用程序“AIffalfa”,以便研究人员和农民能够实时采集和分析作物数据。该应用程序的初步版本已经通过了Google Play商店的审核,未来将通过用户测试和优化进一步完善。研究者认为,这种基于AI的图像分析方法不仅能够提高表型数据的准确性和效率,还能为作物育种和管理提供新的工具和思路。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号