面向多分类的大型高光谱图像数据集OHID-1

【字体: 时间:2025年02月13日 来源:Scientific Data 5.8

编辑推荐:

  

  

探索高光谱图像分类新征程:OHID-1 数据集的诞生与应用


在大数据范式和深度学习技术日益普及的当下,重庆大学教育学院数学与大数据学院的研究人员 Ashish Mani、Sergey Gorbachev 等人,在《Scientific Data》期刊上发表了题为 “OHID-1: A New Large Hyperspectral Image Dataset for Multi-Classification” 的论文。该研究成果意义重大,它推出的新型大规模高光谱图像数据集 OHID-1,为高光谱图像分类领域注入了新活力,有助于推动相关算法的发展,对城市可持续发展科学、土地利用分析等研究有着重要的推动作用。

一、研究背景


高光谱遥感凭借其众多窄光谱带,能为每个波段提供完整图像,与仅具备三个 RGB 波段的传统遥感相比,优势显著。高光谱图像(HSI)的高光谱分辨率使检测物体外观和边界的细微差异变得更为容易,有助于提升地物分类精度;还能依据特定的光发射和吸收特征,更轻松地识别各种材料,实现更好的化学成分分析;不同波段图像间的差异分析意义重大;窄光谱带的运用可降低噪声、减少干扰,便于进行定量分析。这些优势使得 HSI 在农业分析、天气预报、资源测绘等众多领域得到广泛应用。

在 HSI 的应用中,像素分类至关重要。分类需利用标记数据训练模型,模型通过调整内部权重学习每个标记相关的数据特征,直至训练集的总体误差最小化。近年来,计算能力的巨大进步使得这种方法得以广泛应用于 HSI 分析。深度学习中的深度神经网络(DNNs)在诸多挑战性任务中表现出色,但构建 DNN 高度依赖合适的标记数据集。尽管已有一些用于不同任务的大规模、标注良好的数据集,但在 HSI 领域,现有开源数据集存在一定局限性。例如,印度松树(Indian Pines)、萨利纳斯谷(Salinas Valley)和帕维亚大学(Pavia University)等广泛用于分类研究的数据集,数据量相对较小,通常适用于传统算法或浅层 DNNs,浅层 DNNs 学习能力有限,导致网络泛化性能不佳,难以满足实际需求。而且,分类模型的泛化能力需要在不同场景和数据集上进行测试,现有数据集无法满足这一要求。此外,当前许多研究使用机载传感器捕获的数据进行实验,而卫星数据在环境、农业、城市管理等方面具有不可替代的价值,尽管卫星数据存在辐射值校准、几何信息处理、云层影响、空间分辨率低等问题,但探索其应用对社会发展意义重大。在这样的背景下,研究人员构建了 OHID-1 数据集。

二、研究材料与方法


(一)数据集样本


OHID-1 数据集由 “珠海一号” 高光谱卫星星座收集,该卫星星座由珠海欧比特宇航科技股份有限公司(现更名为珠海航天微芯片科技有限公司)设计生产。“珠海一号” 搭载八颗高光谱卫星,可在两天内实现全球观测。卫星有效载荷包含镜头、焦平面、聚焦机制和遮光罩四个主要部分,采用推扫式扫描成像技术,图像宽度达 150km,空间分辨率为 10m,光谱分辨率为 2.5nm,波长范围在 400 - 1000nm。由于传输和存储限制,数据集设计为 32 个可用数据波段(总波段数为 256)。单颗高光谱卫星每天约绕地球 15 圈,单次轨道最大数据采集时间约 8 分钟。OHID-1 数据集提供 10 幅高光谱图像,每幅图像有 32 个光谱波段,尺寸为 512×512 像素,涵盖 7 种类型的地物。

(二)数据标注


OHID-1 数据集使用 7 种标签,主要对应建筑物、道路等基本地物。研究人员从四颗高光谱卫星在 2019 - 2020 年拍摄的原始图像中选取 10 个代表性区域进行标注,区域分布明确。为确保标注准确性,研究人员获取相近日期的高分辨率航拍图像作为参考,并借助 GPS 定位进行实地调查。对于易区分的地物,如建筑物、道路等,参考航拍图像进行确认和手动勾勒;对于变化较快的地物,如裸土、鱼棚等,使用无人机进行现场勘查,并通过无人机的 GPS 匹配 OHID-1 地块坐标,以获取准确的图像区域特征。

(三)数据处理


在数据预处理阶段,研究人员使用 ENVI 软件对收集的数据进行了一系列处理。通过辐射校准,将传感器记录的数字量化值 DN 转换为辐射亮度值 L,辐射校准公式为,其中各参数从元数据文件中获取,校准后的辐射亮度值单位为。利用 MODTRAN 模型和 FLAASH 软件进行大气校正,根据研究区域位置和图像采集时间,选择热带大气校正算法,将图像从表观辐射数据转换为地表反射率。针对图像采集过程中的几何变形问题,通过建立统一坐标系和地图投影、选择地面控制点、确定校正模型和合适的重采样方法,完成几何校正。利用 OHS 高光谱卫星 L1 辐射校正产品提供的 RPC 系数构建有理函数模型,进行正射校正,以校正图像的空间和几何失真。

三、研究结果


(一)数据集质量评估


研究人员选取了五个参数来评估 OHID-1 数据集的质量。在定位精度方面,利用 CE90 评估无控定位精度,确保误差小于 500m;通过选取合适数量和分布的控制点,计算其与真实位置坐标的距离,保证有控定位精度误差小于 3 像素;在全波段图像配准精度上,完成配准后评估各控制点位置,使绝对和地理定位误差相对于数据集中其他产品小于 3 像素。对于辐射校准,检查校准后的图像,计算校准辐射亮度值与真实值的误差,确保相对辐射校准误差小于 3%。在信噪比(SNR)方面,选择太阳高度角大于 30 度、地面反射率大于 0.2 的图像计算 SNR,使其落在 25 - 40 分贝范围内。

(二)算法实验与结果


研究人员使用 8 种深度神经网络(DNNs)和一种传统方法(SVM)在 OHID-1 数据集上进行实验。随机从每个类别中选取 500 个样本作为训练集,其余作为测试集。训练 DNNs 时,采用 Adam 优化器和交叉熵损失函数,对数据进行归一化处理。设置学习率为 0.0001,批量大小为 64,训练 200 个 epoch,在第 50、90、110 个 epoch 时将学习率降低为原来的 0.1。对每个模型训练和测试 10 次,计算总体精度(OA)、平均精度(AA)和 kappa 系数的平均值作为最终结果。训练 SVM 时,通过网格搜索确定参数 cost 为 9.514,gamma 为 0.03125,同样进行 10 次训练和测试。

实验结果表明,大多数方法在 OHID-1 数据集上的性能相较于其他数据集有所下降。例如,1DCNN 在印度松树数据集上的 OA 为 0.861,在 OHID-1 数据集上仅为 0.592;2DCNN 在帕维亚大学数据集上的 OA 为 0.968,在 OHID-1 数据集上为 0.663 等。这意味着 OHID-1 数据集对于当前的 HSI 分类方法来说,标注难度更大,但也为 HSI 分类的进一步发展提供了坚实基础。从不同数据集分类结果的可视化图像可以看出,与真实情况相比,所有预测图在整体区域上都实现了大致正确的预测,体现了人工智能技术对高光谱分类的有效贡献。其中,HyLITE 架构利用变压器产生的分类图更平滑、准确,这得益于变压器能够捕捉数据中的长距离依赖和复杂关系。

四、研究结论与讨论


(一)研究结论


本研究成功构建了 OHID-1 数据集,该数据集具有独特的优势。它拥有 10m 的空间分辨率,在同类数据集中处于先进水平,且包含 10 个场景,有助于测试不同模型。其光谱范围为 400 - 1000nm,有 32 个光谱波段,能提供丰富的光谱信息。通过与其他高光谱数据集对比以及在多种算法上的实验,发现 OHID-1 数据集由于其更复杂的特征,为现有 AI 算法带来了更大的挑战,这表明在开发更准确、强大的分类模型方面仍有提升空间。同时,OHID-1 数据集不仅可用于高光谱图像分类,还能用于测试通用多分类算法,在计算机视觉任务如超分辨率重建等方面也具有应用潜力。

(二)研究意义


OHID-1 数据集的出现,为高光谱图像分类领域提供了新的研究资源。它有助于推动相关算法的改进和创新,促使研究人员开发出更高效、准确的分类模型。在实际应用中,该数据集可广泛应用于城市可持续发展科学、土地利用分析、环境监测、资源管理等多个领域。例如,在环境监测方面,能通过分析高光谱数据识别水体中不同污染物的特征光谱,实现水污染的实时监测和预警;在土地利用分析中,帮助准确判断土地的使用类型和变化情况。此外,研究人员计划未来对 OHID-1 数据集进行扩展,提升其容量,增加类别标签,涵盖更多地形类型,并提供更多区域的数据,同时开发更高效准确的分类和检测算法,以满足日益多样化的应用需求。这一系列举措将进一步推动高光谱图像分类技术的发展,为相关领域的研究和实践提供更有力的支持。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号