为了解决这些棘手的问题,来自美国密歇根大学环境与可持续发展学院(School for Environment and Sustainability, University of Michigan)、密歇根大学信息学院等多个机构的研究人员,开展了一项极具创新性的研究。他们以河流粪便大肠菌群浓度与土地利用和土地覆盖(Land Use and Land Cover,LULC)关系的系统评价为案例,致力于开发和评估一种 AI 辅助的证据筛选框架。这项研究成果发表在《Environmental Evidence》上,为环境科学研究带来了新的曙光。
ROI 分析:通过对比人工筛选和 AI 辅助筛选的成本和时间,研究发现 AI 辅助筛选大大提高了效率。AI 将每篇文章的筛选时间从 4.5 分钟缩短至 0.55 分钟,筛选通量从每小时 13 篇提高到 108 篇,每篇文章节省成本 0.11 美元,总成本降低 10%,整体投资回报率(Return on Investment,ROI)为 10.7%。
研究结论和讨论部分指出,这项研究展示了将 ChatGPT-3.5 Turbo 整合到证据筛选过程中,为环境科学的 AI 辅助系统评价提供了一个结构化框架。AI 模型与评审员的一致性表明其有潜力作为筛选辅助工具,但一致性并不等同于更高的准确性,系统评价的整体可靠性仍依赖于人为定义的标准、验证协议和模型微调决策。此外,研究还发现整合领域知识与 AI 至关重要。在研究中,定义 LULC 类型、“直接关系” 和 “统计关系” 等资格标准时存在诸多问题,这些问题需要专家之间达成共识,并将其整合到 ChatGPT 的筛选框架中。尽管该研究取得了一定成果,但也存在局限性,如模型微调后通用性降低、模型性能依赖训练数据集质量、无法处理非文本数据等。
这项研究的重要意义在于,它为环境科学的系统评价提供了一种新的思路和方法。AI 辅助的证据筛选框架能够更一致地应用资格标准,提高筛选效率,减少劳动力和成本。未来,通过改进训练数据质量、推进 AI 技术以处理图像数据、创建针对不同环境科学子领域的专用语言模型等措施,可以进一步提升 AI 辅助筛选在环境研究中的适应性和有效性,推动环境科学研究朝着更高效、更准确的方向发展。