
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于网络挖掘的区域治理优先事项测绘:德国地方政府网站文本分析新方法
【字体: 大 中 小 】 时间:2025年08月09日 来源:Regional Science Policy & Practice 1.7
编辑推荐:
为解决地方政府战略优先事项数据稀缺问题,Moritz Schütz等学者创新性地采用网络爬虫、自然语言处理(NLP)和机器学习技术,系统分析了德国396个县和7856个市镇官方网站文本。通过BERTopic模型识别205个治理主题,揭示城乡发展、气候保护等议题的空间分异特征,为区域政策研究提供了可扩展的数据分析框架。该研究发表于《Regional Science Policy》,其方法论创新为理解地方治理的"数字足迹"开辟了新途径。
在全球化与区域分化的双重背景下,地方政府如何制定因地制宜的发展战略已成为经济地理学的核心议题。尽管制度经济学早已证明"制度至关重要",但受限于传统调研方法的高成本与低扩展性,学界对地方政府优先事项的系统性认知仍存在巨大空白。这种数据鸿沟严重制约着对区域发展"黑箱"机制的解析——正如Rodríguez-Pose教授所言:"测量制度(尤其是非正式制度)几乎是不可能的挑战"。
德国吉森大学(Justus-Liebig-University Giessen)经济地理系的Moritz Schütz、Lukas Kriesch和Sebastian Losacker团队在《Regional Science Policy》发表的研究,开创性地将网络挖掘技术引入区域治理分析。研究人员构建了包含396个德国县级政府和7856个市镇政府官网的文本数据库,通过多阶段数据处理流程:首先基于德国联邦统计局数据获取行政单位名录,利用Google搜索定位官网入口;继而采用定制爬虫抓取最多500个子页面内容;随后运用Rae等开发的清洗算法过滤非信息文本;最终使用基于Sentence-BERT的BERTopic模型对30余万条有效文本段落进行主题建模。
研究结果部分呈现了丰富发现:
主题分布特征
通过UMAP降维和HDBSCAN聚类识别出205个治理主题,其中30个高频主题涵盖从"城市发展规划"到"志愿者服务"等多元领域。值得注意的是,县级网站平均包含59.77个独特主题,最大值为奥登堡市的153个,反映出地方政府职能的复杂性。
空间分异模式
三个典型案例主题呈现显著地理差异:"城市发展与规划"主题与人口密度呈正相关,而"气候保护倡议"在德国西南部形成热点集群。状态级分析更揭示东西德差异:巴登-符腾堡等西部州在气候和经济议题上表现活跃,而图林根等东部州则呈现同质化低参与特征。
战略表述差异
文本分析捕捉到地方政府对相同议题的差异化表述。如弗伦斯堡市既强调"通过体育路线设计促进社区参与"的草根路径,又展示"委托专业机构制定零售业振兴规划"的技术治理逻辑;帕绍市则突出"2030年内城发展概念"的长期规划框架。
讨论部分指出,该方法突破了传统案例研究的局限,首次实现地方政府战略表述的大规模量化分析。虽然网站文本存在"选择性展示"的固有偏差,但其作为制度话语的载体,能有效反映:1)政策优先级的空间分异;2)正式与非正式治理工具的配置;3)地方政府在多层级治理体系中的自我定位。研究团队公开了县级主题数据集,为后续研究提供基础。
这项研究的意义不仅在于方法学创新——将Transformer架构引入区域政策分析,更在于为"制度如何塑造区域发展"这一经典问题提供了新的实证路径。未来结合纵向追踪与多源数据融合,或将开启"数字治理地理学"的新研究方向。正如作者强调,在区域发展责任日益下沉的今天,理解地方政府如何通过数字媒介构建和传播其战略叙事,对于完善"地方敏感型"政策设计具有重要启示。
生物通微信公众号
知名企业招聘