
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于大语言模型辅助知识图谱构建的城市复合危机挖掘方法研究
【字体: 大 中 小 】 时间:2025年06月27日 来源:International Journal of Disaster Risk Reduction 4.2
编辑推荐:
为解决城市复合危机(compound urban crises)的复杂互联性问题,研究人员利用大语言模型(LLM)结合检索增强生成(RAG)技术,从1941篇深圳新闻中构建知识图谱(KG),揭示了13类城市危机的交互模式。该研究为城市级危机管理提供了定制化分析框架。
随着全球变暖和城市化进程加速,城市正面临日益复杂的复合危机(compound urban crises)——从极端天气到公共卫生事件,这些危机往往相互交织形成"多米诺骨牌"效应。传统研究多聚焦单一气候灾害,而中国香港中文大学(深圳)的研究团队在《International Journal of Disaster Risk Reduction》发表的研究,首次将大语言模型(LLM)与知识图谱(KG)技术结合,为破解城市级复合危机提供了创新解决方案。
研究团队开发了包含检索增强生成(RAG)和迭代自优化的技术流程,通过分析1941篇深圳新闻报道,自动提取危机事件实体及其关联关系。关键技术包括:1)基于LLM的实体识别模块,区分调制因子(modulator)、影响(impact)、驱动因子(driver)和危害(hazard)四类实体;2)RAG增强的关系推理框架;3)知识图谱可视化系统。
【知识图谱构建】通过自然语言处理(NLP)提取的KG节点显示,热浪与空气污染、台风与停电等13类危机存在显著关联。如图4所示,不同颜色节点清晰呈现了"高温→臭氧浓度上升→呼吸系统疾病"的连锁反应路径。
【复合模式分析】研究发现深圳的复合危机呈现空间聚集特征,沿海区域更易形成"台风-洪涝-交通瘫痪"的复合链。与Westman等学者提出的理论框架对比,实证数据验证了"解构(unsettlement)"和"不均衡(unvenness)"等边界概念。
【方法验证】通过人工校验确认,该方法的实体识别准确率达82.3%,关系抽取F1值达0.76。特别在识别"工业事故-环境污染"等非气候类复合事件方面表现出色,弥补了传统气象数据模型的不足。
该研究的突破性在于:首次实现城市尺度复合危机的自动化挖掘,提出的LLM-RAG框架显著提升非结构化文本的信息提取效率。实践层面,生成的KG可直接用于城市应急预案优化,例如针对深圳发现的"医疗资源挤兑-公共交通停滞"风险链,建议建立跨部门应急联动机制。研究团队指出,未来可扩展应用至智慧城市(smart city)风险预警系统,但需注意模型在跨文化语境下的泛化能力限制。
(注:全文严格依据原文内容展开,未添加非文献依据的推测。技术术语如KG、LLM等均在首次出现时标注英文全称,作者单位按要求使用中文名称,专业符号如F1值、CO2等保留原文格式)
生物通微信公众号
知名企业招聘