探秘大堡礁流域水质 “宝库”:珍贵数据的整理与重大意义

【字体: 时间:2025年02月19日 来源:Scientific Data 5.8

编辑推荐:

  为解决大堡礁流域水质数据分散、难以获取的问题,詹姆斯库克大学研究人员开展流域水质数据整理研究,得到超 466 个站点超 26000 条记录的数据集。该研究成果对相关研究和管理意义重大,推荐科研读者一读。

  
在澳大利亚东北部,有一片令人惊叹的自然奇观 —— 大堡礁。大堡礁流域面积广阔,足足有 42.3 万平方千米,涵盖了七个不同的生物地理区域,滋养着各种各样的水生生态系统。然而,自 19 世纪 50 年代欧洲人到来后,这里的 35 个流域发生了巨大的变化。人们引入了放牧动物,开始发展种植业、采矿业,城市也不断扩张。

这些改变虽然给当地带来了经济发展,却也给环境带来了不小的麻烦。土地利用方式的变化深刻地影响了流入大堡礁泻湖的河流的水质。过去 40 年里,有不少监测项目都记录下了这一变化。但尴尬的是,这些监测项目收集的原始数据很多都没有被收录在公开报告中,而是分散在一些零碎且无人维护的在线资源里,有的在纸质灰色文献报告的附录里,还有的甚至只存在于个人电脑硬盘中。这就好比一堆珍贵的宝藏被随意丢弃在各个角落,却没人好好整理,想要使用这些数据的人根本找不到它们。

为了解决这些问题,让这些宝贵的数据能够被充分利用,来自詹姆斯库克大学(James Cook University)的研究人员开展了一项重要研究。他们在《Scientific Data》期刊上发表了一篇名为 “Compilation of riverine water quality data from the Great Barrier Reef catchment area, northeastern Australia” 的论文。通过这项研究,他们成功整理出了大堡礁流域地表溪流淡水河段的水质数据,这可是目前全球范围内关于热带和亚热带淡水水质最全面的历史在线数据集之一呢!这个数据集就像一个装满宝藏的宝库,里面的数据对于研究人员、管理机构以及政策制定者来说都至关重要,为他们的研究和决策提供了坚实的数据基础。

在研究过程中,研究人员主要采用了以下几种关键技术方法:首先是数据采集,他们通过查阅大量文献,还借助了业内人士的口口相传,来寻找潜在的数据集。找到数据后,就向数据提供者申请使用权限。其次是制定数据标准,从地理位置、采样方法、时间范围、参数范围等多个方面制定严格标准,筛选出符合要求的数据。比如,他们会精确核对采样地点的经纬度,根据不同的采样方式进行筛选,还会考虑数据的时间跨度和参数类型等。最后是数据整理与质量评估,把筛选出的数据整理成统一格式,检查数据是否有错误,并根据元数据的情况为每个数据集评定质量等级。

下面来看看研究都有哪些重要发现吧!

数据采集成果


研究人员经过一番努力,从众多潜在数据集中筛选出了 41 个符合要求的水质数据集。这些数据集可不是随随便便选出来的,它们代表了不同研究组织、政府部门、自然资源管理团体以及私人承包商在 1980 年代末到 2023 年期间开展的监测项目成果。在筛选过程中,那些采样数量太少(每个站点总共少于 5 个样本)、收集于农场或地块精细尺度(因为研究重点是水道)的数据,还有因为电脑硬盘损坏丢失原始数据、涉及数据保密问题以及联系不上主要研究人员的数据,都被排除在外了。

数据特征


  • 监测站点分布:这些数据集涵盖了 466 个监测站点,不过站点的分布并不均匀。从空间上看,集中分布在凯恩斯到麦凯的沿海地区,而约克角、伯内特 - 玛丽和菲茨罗伊自然资源管理区域的监测站点相对较少。这种分布差异主要是因为沿海地区农业、城市和工业活动密集,而且这些地方也是河流流入大堡礁泻湖的下游关键位置。
  • 测量参数情况:研究人员对各个站点测量的参数进行统计后发现,氧化氮(NO<sub>X</sub>)是测量次数最多的水质参数,有 20559 条记录;其次是铵(19945 条)、可过滤活性磷(FRP,19746 条记录)以及总悬浮固体(TSS)或总固体(18355 条记录)。这些参数从 20 世纪 80 年代末开始就是大多数流域末端负荷和特定土地利用监测项目的基础,它们的空间分布和站点分布趋势相似,但也存在一些差异。

数据记录形式


这些精心整理的数据被存放在詹姆斯库克大学的研究数据存储库中,同时也能在昆士兰政府的 Tahbil - 水质数据门户上公开获取。每个数据集都以 MS Excel 文件的形式呈现,包含 3 个工作表,分别记录着项目元数据、站点位置查找表以及水质数据。文件中的数据按照宽格式排列,每个变量都有两列,一列记录操作符,另一列记录变量值,单位标注在变量名称下方。此外,研究人员还提供了单独的站点表和参数表,方便大家查看。而且,每个项目数据集都有详细的元数据声明,这些声明经过数据提供者的审核和认可,里面包含了项目的各种关键信息,对使用者来说是非常重要的参考资料。

研究人员还对数据进行了技术验证。他们把所有贡献的数据集都整理成一致的模板,统一了单位。在这个过程中,为了避免转录错误,他们仔细检查了至少 10% 的数据项。虽然很多数据集本身已经通过了标准采样程序和内部质量控制流程,但研究人员考虑到历史水质数据技术验证的局限性,没有进一步验证数据,而是根据元数据的情况为每个数据集分配了质量代码。质量代码分为 “好(910)”“一般(920)”“差(930)” 三个等级,分别代表元数据信息描述的不同完整程度。

不过在使用这些数据的时候,也有一些需要注意的地方。由于数据来自多个不同的实验室,使用的提取程序、分析方法和仪器都不一样,所以在综合分析不同来源的数据时要格外小心。比如,分析总氮的方法就有凯氏定氮法和过硫酸盐消化法,不同方法适用于不同特性的水样,得到的结果也有所差异,所以在合并数据时一定要谨慎。还有分析总磷和总溶解磷的方法也有多种,不同方法的效果在不同水样中也有区别。此外,在分析总悬浮固体(TSS)浓度时,不同的滤膜孔径也可能会对结果产生影响。除了方法差异,数据集中还存在术语不一致的问题,像溶解无机磷就有多种不同的表述方式,这也容易让人产生混淆。

而且,很多数据集还缺少一些关键信息,比如样品处理的详细过程,这对评估数据的实用性有很大影响。另外,虽然现在有专门的数据存储平台可以记录一些相关信息,但这些平台的维护和成本问题也让人担心。其实,除了这次整理的数据集,还有很多其他渠道可能存在有价值的水质数据,比如与采矿等行业相关的合规监测数据、水库和湖泊等其他水生环境的数据,以及不断发展的传感器技术收集的数据。只是把这些数据整合起来还面临很多挑战,但为了不让这些数据白白流失,还是很有必要去做的。

总的来说,这项研究意义重大。研究人员成功整理出大堡礁流域的历史水质数据集,为后续研究提供了宝贵的数据资源。虽然在数据的综合使用和管理方面还存在一些问题,但这也为未来的研究指明了方向。希望通过这项研究,能让更多人关注到现有的水质监测项目,也为进一步研究大堡礁流域的水质变化、生态环境影响以及制定科学合理的管理政策提供有力的支持,让大堡礁这片美丽的海域能够得到更好的保护和发展。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
生物通微信公众号
微信
新浪微博

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号