混凝土裂缝推理:一种可解释的缺陷诊断方法,该方法结合了预训练的生成式Transformer 4模型和多模态无损检测数据

《AUTOMATION IN CONSTRUCTION》:Concrete crack reasoning: Explainable defect diagnosis incorporating generative Pretrained transformer 4 and multimodal nondestructive testing data

【字体: 时间:2025年12月04日 来源:AUTOMATION IN CONSTRUCTION 11.5

编辑推荐:

  提出Concrete Crack Reasoning(CCR)框架,通过传感器特定CNN提取GPR、UT、IE多模态特征并转化为阈值导向的可审计文本,结合GPT-4在自适应细化模式下利用提示库检索实现自我校正,在1088样本四类桥梁缺陷数据集上实现准确率87.8%-97.9%,置信区间±1.8%,显著提升可解释性和部署可行性。

  
Sujin Jin|Homin Song|Jungoo Kang|Byoungjoon Yu|Seunghee Park
韩国水原市成均馆大学土木与环境工程系,邮编16419

摘要

及时检测混凝土的老化与劣化需要结合实验室级精度和现场适用性的诊断方法。现有模型存在决策过程不透明以及多模态传感器数据整合能力有限的问题。本文提出了“混凝土裂缝推理”(Concrete Crack Reasoning, CCR)这一经过现场验证的诊断框架,该框架通过两个模块克服了这些限制:(i)传感器特定的卷积神经网络(CNN)从探地雷达(GPR)、冲击回波(IE)和超声波检测(UT)中提取特征,并将其转化为简洁、人类可读的文本;(ii)基于GPT-4的推理阶段,该阶段支持基线(Baseline)、反馈(Feedback)和自适应优化(Adaptive Refiner)三种模式,其中自适应优化模式利用提示检索进行自我修正。在包含1088个样本、四个类别的桥梁甲板数据集上,CCR的准确率从49.4%提升至87.8%,95%的置信区间缩小至±1.8%。自适应优化模式下的解释过程采用了与专家实践一致的语言,增强了可审计性。由于该框架采用轻量级的模型内检索机制且无需外部数据库,因此可在资源有限的环境中部署,为实现可解释的AI辅助结构健康监测提供了实用途径。

引言

老化的混凝土基础设施是一个紧迫的全球性工程挑战。在美国,617,084座高速公路桥梁中已有42%超过了其50年的设计寿命[1]。在韩国,政府报告显示2014年至2019年间道路和桥梁维护费用约为24万亿韩元,相当于每年4万亿韩元(约合30亿美元)[2]。这些支出凸显了迫切需要能够提前发现隐蔽缺陷的结构健康监测(SHM)方法。
探地雷达(GPR)、超声波检测(UT)和冲击回波(IE)仍是主要的无损检测(NDT)工具。然而,这些技术的解释仍主要依赖人工完成,这不仅耗时且容易出错。美国联邦公路管理局的一项研究显示,评估相同桥梁构件的不同检查员之间的视觉状况评级存在至少一级差异[3]。这种主观性凸显了需要结合准确性和可验证解释的自动化诊断工具的必要性。
深度学习,特别是卷积神经网络(CNN),在SHM和NDT领域取得了显著进展[[4], [5], [6]]。CNN能够捕捉复杂信号中的潜在模式,但面临两个关键限制:首先,CNN的决策过程缺乏透明度,这会削弱人们对安全关键领域的信任[7,8];其次,大多数模型无法直接融合异构的多模态数据,通常需要单独的处理流程,从而降低了诊断的清晰度[9,10]。主流的可解释AI(XAI)技术如Grad-CAM、LIME或SHAP虽然在图像识别方面表现良好,但在噪声较大或多模态的SHM数据下性能下降,生成的显著性图往往与实际缺陷特征不符[[11], [12], [13]]。
尽管最近人们探索了变压器(transformers)、自编码器(autoencoders)和图神经网络(GNN)来提高建模灵活性[[14], [15], [16]],但可解释性方面的问题依然存在。在基础设施诊断中,工程师必须为每个与安全相关的决策提供依据,因此这种透明度不足是不可接受的[[17], [18], [19]]。
此外,针对特定现场条件重复训练深度模型会带来高昂的成本和操作延迟,而环境变化(如光照变化、湿度或表面粗糙度)会进一步降低模型性能[[20], [21], [22]]。这些限制凸显了需要轻量级、可解释且可在现场部署的诊断框架的需求,这些框架能够在无需频繁重新校准的情况下提供透明的推理。
本研究的目标有三个:(i)介绍并评估“混凝土裂缝推理”(CCR)这一可解释的诊断框架,该框架利用GPR、UT和IE对桥梁甲板的四种缺陷等级(0-3级)进行分类;(ii)将CNN特征转化为简洁的、基于阈值的文本描述,并利用GPT-4生成可被检查员验证的推理依据,从而量化其相对于仅使用CNN和传统方法的优势;(iii)定量评估该框架的可解释性、准确性和安全性(如规则违反率、延迟率、一致性)。
为了实现这些目标,本文提出了“混凝土裂缝推理”(CCR)这一专为SHM设计的分解释释AI框架。CCR通过传感器特定的CNN编码器处理多模态NDT数据(GPR、UT、IE),然后利用基于阈值和百分位的特征到文本转换将判别特征转化为结构化的、可审计的文本,并借助GPT-4进行诊断分类。尽管GPT-4具有先进的推理能力,但其缺乏透明度以及在关键任务中可能出现幻觉的问题需要谨慎评估风险。CCR的主要目的是提高可审计性和多模态解释性;在实际应用中,其特征到文本的转换和基于记忆的优化可以在一定程度上限制幻觉的发生,但无法完全消除这种现象。
本研究的主要贡献如下:
  • 整合CNN和GPT-4,实现准确的缺陷分类,并确保逻辑透明,弥补了传统CNN的透明度不足。
  • 开发了一种特征到文本的转换方法,将抽象的数值向量转化为易于理解的自然语言解释。
  • 引入了提示工程(Prompt Engineering)优化机制,以在数据稀缺和不平衡的情况下维持性能。
  • 设计了自适应优化(Adaptive Refiner)模式,该模式可以从提示库中检索成功的案例,实现无需重新训练的自适应自我修正。
  • 总结来说,CCR提供了一个可解释的多模态诊断框架,它将先进的深度学习技术与可解释的推理相结合。通过结合准确性和透明度,它为实现可信的AI辅助结构健康监测提供了实用途径。本文的其余部分安排如下:第2节回顾相关研究,第3节描述数据集和预处理过程,第4节介绍方法论,第5节报告结果和讨论,第6节总结研究意义和未来发展方向。

    相关研究

    相关工作

    本节总结了混凝土结构健康监测和无损检测领域的主要挑战及最近的AI解决方案,为本文的贡献提供了背景信息。

    数据获取与数据集结构

    本文涵盖了桥梁位置、周围环境、数据集结构、预处理流程以及用于将观察到的缺陷与实际修复策略关联起来的损伤分类框架。

    方法

    本文提出了一种利用多模态无损传感器数据可解释地诊断混凝土结构缺陷的框架(CCR)。CCR整合了基于深度学习的特征提取、特征到文本的转换以及基于大语言模型(LLM)的结构化推理,以实现透明的结构健康评估。该框架使用专用的CNN编码器处理GPR、IE和UT数据,并根据不同类别提取中间特征并转化为诊断文本。

    结果与讨论

    本节展示了CCR框架的结果,包括数据集特征、CNN特征分析、GPT-4的推理性能,以及基于反馈和记忆的策略在准确性和可解释性缺陷分类方面的效果。

    结论

    本文提出了一种结构化框架,通过结合基于反馈的自我修正和基于提示库的记忆引导策略,提升了GPT-4在混凝土结构缺陷分类方面的诊断推理能力。通过从基线模型逐步改进到反馈模型,最终实现自适应优化模型,模型的准确性、推理一致性和语义深度得到了显著提升,最终准确率达到97.96%。

    CRediT作者贡献声明

    Sujin Jin:撰写初稿、方法论设计、概念构建。Homin Song:可视化处理、验证工作。Jungoo Kang:数据整理。Byoungjoon Yu:撰写与编辑。Seunghee Park:撰写与编辑。

    利益冲突声明

    作者声明没有已知的财务利益冲突或个人关系可能影响本文的研究结果。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普
    • 急聘职位
    • 高薪职位

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号