《Biological Invasions》:Quantifying uncertainty in forecasts of when and where invasions happen
编辑推荐:
这篇综述聚焦入侵物种预测中的不确定性量化问题。研究人员通过文献回顾,依据生态预测倡议标准评估现状。发现仅 29% 的动态、空间交互预测报告了不确定性,且存在诸多问题。文章探讨了挑战,提出改进建议,对提升入侵预测准确性意义重大。
一、入侵物种预测的重要性与不确定性问题
在全球生态环境变化的大背景下,入侵物种成为人类介导的全球环境变化的关键驱动因素。它们对生物多样性、生态系统服务以及人类健康产生负面影响,同时管理成本也在不断增加。预测入侵物种何时何地到达和扩散的模型,对于合理配置有限资源、制定积极且具有成本效益的管理策略至关重要。
理想的模型应具备动态性(某一时期的情况会影响未来时期)和空间交互性(一个地方发生的情况会影响其他地方),以此来反映入侵物种在地理空间中的扩散。并且,预测还应包含不确定性的定量估计,这样既能避免决策时过度自信或过度谨慎,也能为改进未来的预测提供依据。
然而,入侵预测存在许多内在的不确定性。这些不确定性源于多个方面,例如新到达物种的识别或列入存在延迟,对扩散驱动因素的机制理解存在差距,入侵早期数据有限等。此外,记录入侵影响时的偏差和错误也会给管理场景带来不确定性。根据生态预测的分类,入侵预测中的不确定性可分为初始条件不确定性、驱动因素不确定性、参数不确定性、参数变异性和过程误差这五类。
二、研究方法
为了系统评估入侵预测中的不确定性量化情况,研究人员采用了一套严谨的方法。首先,他们使用逐步工作流程和定义好的查询词、选择标准、评估矩阵以及不确定性定义,从 Web of Science 核心合集检索相关文献。检索时在 “主题” 字段使用查询词,以涵盖广泛的预测入侵的学科领域,同时使用额外查询词排除不相关的内容,如 “癌症”“心脏”“外科手术” 等,最终检索出 1811 篇论文。
接着,依据五个选择标准对论文进行评估。这些标准要求论文必须使用模型对入侵物种在地理空间中某一或多个特定时间点的分布变化进行预测,并且排除了预测入侵物种潜在地理范围的部分模型(如许多不符合特定日期的环境生态位模型)。经过筛选,452 篇论文符合所有标准,随后对这些论文进行全文审查。
之后,研究人员应用评估矩阵对论文的全文和补充材料进行分析,分类记录研究特征、预测尺度、所用模型以及是否报告了总体预测不确定性。在此基础上,进一步筛选出使用动态、空间交互模型且报告了不确定性的 55 篇论文,对这些论文中多种不确定性来源的讨论、建模、传播和划分情况进行详细评估。两位评审人员独立阅读每篇论文,依据生态预测框架中定义的来源,对不确定性来源进行分类,并讨论形成一致的提取结果,每周与更广泛的团队审查问题和分歧以达成共识。最终确定了 15 类讨论不确定性的方式、9 类建模方式、6 类传播方式和 3 类划分方式,并对论文中使用的方法进行编码和频率分析。
三、研究结果
- 入侵预测的特征:在 452 篇符合标准的论文中,65% 报告了模型准确性,19% 报告了最终模型预测的不确定性,只有 9% 报告了空间不确定性,9% 报告了时间不确定性,3% 两者都报告。大多数预测的分辨率适中,与主要气候数据集对齐,空间范围从区域到大陆不等,时间步长较短的预测通常是 “近期” 预测,而时间范围较长的预测往往包含较少或单个时间步长。
动态、空间交互且报告不确定性的预测主要集中在陆地脊椎动物和疾病宿主系统,其中入侵生物为微生物的情况较多,相比之下,入侵无脊椎动物和植物在详细不确定性评估中占比较少。这些预测大多使用基于过程的模型(91%),在模拟场景方面,管理场景最为常见,而气候场景相对较少,因为气候场景预测通常使用的相关模型不具备动态性和空间交互性。
- 不确定性来源:55 篇论文讨论的不确定性来源中位数为 5 个,其中中位数为 3 个进行了建模,中位数为 2 个进行了传播,但只有 8% 的不确定性来源进行了划分。
过程误差、参数不确定性和初始条件不确定性是讨论最多的来源。过程误差是传播到预测中最常见的不确定性来源,其次是参数不确定性和初始条件不确定性。驱动因素不确定性和参数变异性较少被讨论、建模和传播。
对于初始条件不确定性,常见的表现形式包括未知的初始种群位置和人口统计信息、可变或非随机的调查设计以及物种建立和检测之间的时间滞后等。建模方法包括随机抽样种群值、使用模拟数据运行模型或包含误差的观测模型等;传播方法有使用初始值的集合运行模型、进行敏感性分析和纳入随机误差项等。
驱动因素不确定性通常源于不确定的未来结果、未知的输入重要性以及模型产生的未来数据驱动因素的不确定性等。建模方式主要是模拟多个不同的预测场景并进行比较或平均;未被建模和传播的常见来源包括不完整的驱动数据和驱动数据空间缩放对结果的影响。
参数不确定性包含未知的模型参数,常通过校准数据或定义合理范围或分布进行建模,传播方式是通过对参数集的集合进行模拟或从拟合的后验分布中采样;当不传播时,通常使用单个参数集进行最终预测。
参数变异性常被讨论为可能在空间或时间上变化的影响,但较少被建模和传播,当建模时,常通过随机误差项传播的时空自相关来表示。
过程误差代表模型未捕获的现实世界变异性,常通过一个或多个随机过程建模,并通过多个随机模拟产生预测;有些情况下,过程误差以替代模型结构决策或未建模过程的形式讨论,但未进行评估。
- 不确定性划分情况:55 篇论文中只有 3 篇对多个来源的不确定性进行了划分,其中 2 篇使用统计模型分析预测不确定性对不同输入的响应,1 篇通过敏感性分析计算弹性。另外 3 篇对单一来源内的不确定性进行了划分,还有 5 篇报告了多个场景的结果和相关不确定性,以便比较模型配置或输入对不确定性的贡献。
四、讨论
- 未报告的不确定性:在已发表的地理空间和时间入侵预测中,不确定性报告并不常见。在报告不确定性的预测中,许多不确定性来源被讨论但未传播到预测中,这可能导致报告的不确定性低估了实际存在的总不确定性。
初始条件不确定性在入侵不确定性中可能起着较大作用,因为入侵模型对其较为敏感,且在入侵场景中初始条件不确定性往往较高且难以量化,例如入侵物种的初始位置和人口统计条件常常未知,检测延迟也普遍存在。
驱动因素不确定性源于当前和未来环境条件信息的差距,当前数据的不确定性常归因于观测不完整或间接测量,未来驱动因素预测的不确定性对长期预测尤为重要,但这种不确定性大多通过场景评估,而非从量化的数据不确定性中传播,可能是由于传播方法的知识限制和计算成本过高。此外,数据、模型配置和建模过程的空间或时间尺度不匹配也会导致驱动因素不确定性。
参数不确定性主要源于将未知模型参数校准到过去入侵观测的时间和位置,可通过更多物种观测或先验知识约束来降低。但对于许多新兴入侵物种,生命史信息往往不可用,跨国数据共享限制也增加了获取相关参数的难度。
参数变异性在入侵预测文献中讨论和传播最少,但实际上空间和时间变化对大多数入侵可能都很重要,建模者可通过纳入分层变化参数和空间或时间效应来考虑这一不确定性来源。
过程误差的主要来源是未建模的变异性,常通过随机模型元素表示精细尺度的繁殖和扩散过程,许多扩散驱动因素未知,扩散核的功能形式也缺乏实证数据约束。部分论文未评估模型结构不确定性,可能会遗漏重要不确定性,影响管理决策。
- 划分不确定性的障碍:空间和时间范围及分辨率、模型复杂性和不确定性都会增加入侵预测的计算需求。虽然在其他动态生态预测中不确定性划分逐渐普遍,但在入侵预测中仍很有限,这可能是由于地理空间,尤其是动态、空间交互预测中划分不确定性的计算需求和方法挑战较大。
不确定性划分有助于识别影响入侵预测的主要不确定性来源,但由于划分不确定性的论文数量较少,这些论文确定的主要不确定性来源可能不具有代表性。可靠地提取和比较预测之间的不确定性信息依赖于公开数据、模型和预测输出,生态预测社区已提出发布预测及其不确定性信息的标准框架,公开预测还能促进比较研究,评估量化不确定性对决策的重要性。
- 未来展望:物种入侵成本不断上升,明确考虑不确定性的传播预测有助于确定可通过额外数据收集和研究减少的主要不确定性来源,量化不确定性不仅能让预测模型使用者更信任预测结果,还能为研究投资提供重点方向。
入侵建模者可通过现有建模工作流程更好地量化不确定性,例如报告随机模型的不确定性、使用采样参数集传播校准参数的不确定性、使用模型集合而非单一最佳拟合模型进行最终预测。同时,已有方法可用于在入侵模型中纳入不确定性,如场景分析和传统建模方法,进一步整合生态预测方法可产生更可靠的不确定性估计,其他学科在不确定性划分方面的进展也为入侵预测提供了可借鉴的方法,这些方法还能惠及相关领域的预测。
娑撳娴囩€瑰宓庢导锔炬暩鐎涙劒鍔熼妴濠団偓姘崇箖缂佸棜鍎禒锝堥樋閹活厾銇氶弬鎵畱閼筋垳澧块棃鍓佸仯閵嗗甯扮槐銏狀洤娴f洟鈧俺绻冩禒锝堥樋閸掑棙鐎芥穱鍐箻閹劎娈戦懡顖滃⒖閸欐垹骞囬惍鏃傗敀
10x Genomics閺傛澘鎼isium HD 瀵偓閸氼垰宕熺紒鍡氬劒閸掑棜椴搁悳鍥╂畱閸忋劏娴嗚ぐ鏇犵矋缁屾椽妫块崚鍡樼€介敍锟�
濞嗐垼绻嬫稉瀣祰Twist閵嗗﹣绗夐弬顓炲綁閸栨牜娈慍RISPR缁涙盯鈧鐗哥仦鈧妴瀣暩鐎涙劒鍔�
閸楁洜绮忛懗鐐寸ゴ鎼村繐鍙嗛梻銊ャ亣鐠佹彃鐖� - 濞e崬鍙嗘禍鍡毿掓禒搴n儑娑撯偓娑擃亜宕熺紒鍡氬劒鐎圭偤鐛欑拋鎹愵吀閸掔増鏆熼幑顔垮窛閹貉傜瑢閸欘垵顫嬮崠鏍掗弸锟�
娑撳娴囬妴濠勭矎閼崇偛鍞撮摂瀣鐠愩劋绨版担婊冨瀻閺嬫劖鏌熷▔鏇犳暩鐎涙劒鍔熼妴锟�