BioDiv-3DTrees:德国森林多样性大样地中4952株单木点云、定量结构模型与树形图的大规模标注数据集
《Scientific Data》:A large dataset of labelled single tree point clouds, QSMs and tree graphs
【字体:
大
中
小
】
时间:2025年12月18日
来源:Scientific Data 6.9
编辑推荐:
为解决森林监测与生态研究中高分辨率单木三维数据稀缺的问题,研究人员开展了“BioDiv-3DTrees”数据集构建研究。该研究通过地面激光扫描(TLS)与无人机激光扫描(ULS)技术,获取了德国生物多样性探索区4952株19个树种的单木点云,并为其中3386株阔叶树生成了定量结构模型(QSM)与图表示。数据集与现有森林清查数据关联,提供了树种、胸径(DBH)和树高等关键参数。研究成果为生物量估算、算法开发及传统清查方法的数据融合提供了可靠资源,对推动森林科学与遥感研究具有重要意义。
树木是森林生态系统的主体,其精确的三维结构信息对于理解森林生长、估算碳储量以及进行可持续管理至关重要。然而,传统森林调查方法往往依赖于人工测量,不仅效率低下,且难以获取树木精细的冠层结构和分枝形态等关键参数。近年来,随着遥感技术的发展,特别是地面激光扫描(Terrestrial Laser Scanning, TLS)和无人机激光扫描(Unmanned Aerial Vehicle Laser Scanning, ULS)的应用,为高精度、非破坏性地获取树木三维信息提供了强大工具。通过激光扫描获得的点云数据,可以进一步构建树木的定量结构模型(Quantitative Structure Models, QSM),将复杂的树木结构简化为一系列三维圆柱体的集合,从而便于进行体积、生物量等几何参数的量化分析。尽管已有一些公开的树木点云数据集,但在数据规模、树种多样性、以及同时包含TLS/ULS点云、QSM模型、图表示和详尽的森林清查背景信息方面,仍存在明显不足。例如,现有的pytreedb数据集覆盖区域有限,且仅有少量树木同时具备TLS、ULS和清查数据;FOR-species20K数据集虽规模较大,但未提供QSM表示;而Yazdi等人的数据集则主要针对城市树木。这种高质量、多源融合数据的缺乏,制约了机器学习模型训练、三维重建算法基准测试等研究的深入开展。
为了填补这一空白,由德国哥廷根大学森林清查与遥感系的Nils Griese领衔的研究团队,在《Scientific Data》上发表了题为“A large dataset of labelled single tree point clouds, QSMs and tree graphs”的数据描述论文,正式发布了名为“BioDiv-3DTrees”的大型数据集。该数据集源自德国生物多样性探索性(Biodiversity Exploratories)这一长期生态研究平台的27个森林样地,聚焦于其森林间隙实验(FOrest gap experiment, FOX)样地。研究团队通过系统的野外数据采集、严谨的数据预处理流程和严格的质控标准,构建了一个包含4952株树木(涵盖19个树种)的TLS和ULS点云数据集,并为其中的3386株阔叶树生成了经过验证的QSM模型及其对应的图(Graph)表示。每个树木个体均与开放的森林清查数据集相关联,确保了树种身份、胸径(Diameter at Breast Height, DBH)、树高等属性的可靠性。这一数据集的发布,为森林监测、清单开发、生态学研究以及相关算法创新提供了极为宝贵的基础资源。
本研究的技术方法核心在于多平台激光扫描数据的获取与融合处理。研究人员在德国生物多样性探索性的三个研究区域(Schorfheide-Chorin, Hainich-Dun, Schwabische Alb)的54个FOX实验样地开展工作。TLS数据使用Leica BLK360 G1扫描仪,在每块样地设置5个扫描位点(中心及四个象限方向),并创新性地在2.2米和8米两个高度进行扫描,以更好地捕捉树冠信息。ULS数据则通过搭载Phoenix LiDAR Systems Recon-XT扫描仪的DJI Matrice 300 RTK无人机,在75米高度以平行线飞行方式获取。点云预处理包括使用商业软件进行配准、利用CloudCompare中的迭代最近点(Iterative Closest Point, ICP)算法进行TLS与ULS点云对齐、使用TreeLearn算法进行单木分割,并采用直方图离群值检测方法清理分割后的点云。树木与森林清查数据的匹配通过基于点云的树干位置提取和空间变换(扩展相干点漂移算法)实现。QSM重建使用广泛认可的TreeQSM (v2.4.1)算法,并应用rTwig包进行异速生长校正以优化生物量估算。最后,对QSM衍生的树形图进行了拓扑清理,以确保分支连接的真实性。数据质量通过将QSM反演的树高、DBH和冠层投影面积(Crown Projection Area, CPA)与原始点云计算结果进行对比验证。
BioDiv-3DTrees数据集通过GROdata平台公开共享。其核心内容包括单株树木的TLS和ULS点云(LAZ格式)、阔叶树的QSM模型(校正后的CSV文件和原始MAT文件)以及清理后的图表示(GraphML格式)。数据集已预先划分为训练集(80%)、验证集(10%)和测试集(10%),并考虑了树种分层。数据集中最主要的树种为欧洲山毛榉(Fagus sylvatica)、挪威云杉(Picea abies)和欧洲赤松(Pinus sylvestris),占总数的80.7%。所有树木坐标均相对于官方样地中心坐标进行了归一化处理,便于分析使用。文件命名规则清晰,基于FOX样地标识符、TreeLearn分配的树木编号和数据类型。
为确保数据质量,研究团队实施了严格的技术验证。首先,通过人工目视检查每个树木点云的XY、XZ、YZ投影图来验证分割准确性,据此剔除了190个分割不佳的树木,最终保留了4952株树木。其次,对生成的QSM模型进行了关键参数的交叉验证:将基于QSM计算的DBH、树高和CPA与从原始TLS点云中提取的相应值进行比对。验证标准设定为:QSM DBH与点云DBH差异在±2厘米以内,树高差异在±1米以内,CPA差异在±2平方米以内。结果显示,分别有2615株(DBH)、3384株(树高)和2605株(CPA)树木的QSM模型通过了验证。最终,有1925株树木的QSM模型在所有三项验证中均符合标准,被标记为有效QSM(validQSM)。这些验证步骤显著提升了数据集的可靠性和可用性。
研究者需注意,ULS数据对林下小树的覆盖可能因上层树木遮挡而不完整。为此,数据标签文件(labels.csv)中提供了每株树木的ULS点云数量(nULS)字段,用户可据此筛选在两种数据源中均清晰可见的树木。此外,标签文件还包含了树种、各类测量变量、QSM体积以及是否被选中进行QSM重建和是否通过QSM验证等详细信息,为不同研究目的的数据筛选提供了便利。
综上所述,BioDiv-3DTrees数据集的价值在于其规模性、高质量和多源性。它首次在温带森林生态系统中,大规模地提供了匹配了详细地面清查信息的TLS与ULS单木点云、经过严格验证的QSM模型以及拓扑结构合理的树形图。该数据集不仅可直接用于树木结构参数(如生物量、体积)的精确估算,推动森林碳汇研究,更重要的是,它为计算机科学和遥感领域开发和应用新的机器学习算法(如树种分类、点云分割、三维重建)提供了高质量的基准数据。通过将先进的遥感技术与扎实的生态学调查相结合,BioDiv-3DTrees为理解和可持续管理复杂的森林生态系统奠定了坚实的数据基础,对应对气候变化和生物多样性保护等全球性挑战具有长远意义。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号