编辑推荐:
为解决全球历史政治实体数字化编码不全面、获取困难等问题,研究人员开展了 Cliopatria 项目,构建了从公元前 3400 年到公元 2024 年全球政治实体的开源地理空间数据集。该成果有助于多学科研究,推动对全球历史动态的理解。
在历史研究领域,随着线上历史数据库的不断涌现,人们对全球历史动态的科学理解取得了显著进展。通过空间明确的模型和实证研究,学者们发现了复杂社会兴衰的重要规律。传统历史研究也借助地理空间信息,探索语言传播、区域交流等现象。然而,当前历史研究面临诸多挑战。一方面,由于缺乏准确的历史边界数据,很多研究不得不使用当代地理空间边界,这可能掩盖过去重要的政治发展,导致测量误差。另一方面,现有的数字地理数据集存在局限性,多数数据集范围有限,一些综合性的地理空间数据集要么需要授权,要么存储格式专有,难以用于学术分析。为了突破这些困境,来自美国华盛顿大学、奥地利复杂性科学中心等机构的研究人员开展了 Cliopatria 项目,相关研究成果发表在《Scientific Data》上。
在研究方法上,研究人员首先基于 2014 年由 Andrew Tollefson 开发的一组复合数字插图(地图图像)创建了 Cliopatria。这些地图图像的政治边界是从原始源地图中手工重新绘制到通用数字底图上的,起始于公元前 3400 年的苏美尔城邦,后续图像根据文献记载的政治实体变化逐年修改。之后,研究人员开发 Python 代码将图像上的手工着色区域转换为多边形,并借助 Seshat 数据库项目研究人员的帮助,对名称、多边形及其与其他数据集的关联进行了广泛审查和手工编辑,从而形成了 Cliopatria 数据库。
研究结果方面:
- 数据库构成:Cliopatria 数据集目前包含超过 1600 个政治实体,这些实体在不同的时间步长和空间尺度上进行采样。数据以 “cliopatria.geojson” 文件形式存储,约有 15K 条记录,每条记录包含实体名称、存在时间范围、面积、类型、相关维基百科页面、Seshat ID(如有)、所属复合政体(如有)以及多边形几何信息等。
- 数据验证:通过与原始和其他地图图像的目视检查和比较,以及与 Taagepera 的研究结果对比,发现二者结果相似,但 Cliopatria 数据库列出了更多的草原游牧帝国。同时,与 Seshat 数据库中相关实体的面积数据对比显示,二者匹配度良好,线性拟合几乎为 1:1,解释了近 90% 的方差。不过,与其他历史地理空间数据库对比时,在某些地区存在差异,尤其是在欧亚游牧草原帝国的存在和范围方面。
研究结论和讨论部分指出,Cliopatria 数据集为全球历史政治地理的研究提供了重要资源,其开源特性便于学者使用和改进。尽管目前该数据集存在一些局限性,如无法编码边界不确定性和领土争端,对某些地区的反映可能不够准确等,但随着学术社区的不断完善,有望基于历史学家的输入改进边界数据,并对剩余的不确定性或争端进行合适的编码。这不仅有助于更准确地研究历史政治实体的演变,还能为多学科研究提供有力支持,推动对全球历史动态的深入理解,在历史研究、社会科学等领域具有重要意义。