
-
生物通官微
陪你抓住生命科技
跳动的脉搏
多粒度图推理驱动的船舶机舱故障语义实体识别与知识提取研究
【字体: 大 中 小 】 时间:2025年07月31日 来源:Knowledge-Based Systems 7.6
编辑推荐:
为解决船舶机舱故障文本中实体类型多样、边界模糊及特征区分度低等问题,大连海事大学团队提出基于多粒度图推理的语义实体识别方法,通过构建字符-词-短语三级图结构,结合图Transformer实现跨粒度信息融合,显著提升故障知识提取精度,为智能决策系统提供结构化知识支持。
在船舶智能化浪潮中,机舱设备故障诊断如同"海上黑匣子"的解码难题——故障报告里充斥着"冷却水泵损坏引发高温报警"这类专业表述,实体类型横跨部件(PAR)、现象(PHE)、故障(FAU)等6类,嵌套结构和术语相似性让传统命名实体识别(NER)模型频频"触礁"。更棘手的是,相同的"压力不足"在文本中可能对应现象(Operational State)或故障原因(Cause),这种语义鸿沟严重制约智能维护系统的决策准确性。
大连海事大学轮机工程学院的研究团队在《Knowledge-Based Systems》发表的研究中,创新性地将多粒度图推理引入船舶机舱故障语义实体识别。该研究通过三级图建模(字符-词-短语)构建知识"立体雷达",配合图Transformer(GTN)实现跨粒度语义巡航,最终开发出能精准捕捉"柱塞副卡死"等专业术语边界的智能识别系统。关键技术包括:基于BERT的文本编码、动态短语库构建的图节点生成、跨粒度对比学习框架,以及独创的边界平滑策略。实验证明该方法在自建数据集上F1值达91.2%,较BiLSTM-CRF提升7.3%。
【多粒度图建模机制】
通过字符级捕捉"燃油喷射器"等复合词形态特征,词级建模"密封性能下降"的领域术语,短语级关联"冷却系统压力异常→主机过热"的因果链,形成覆盖3.7万专业术语的动态图谱。
【跨粒度信息交互】
GTN网络在三级图谱间建立自适应连接,如将字符"泵"与短语"海水泵轴封泄漏"动态关联,使模型能识别"泵"在孤立出现时仍属部件实体(PAR)。
【边界优化策略】
针对"喷油器磨损/密封失效"这类边界模糊表述,通过邻居节点特征加权平滑,使实体分割准确率提升12.6%。对比学习模块则有效区分了"现象(PHE)"与"故障(FAU)"的语义细微差异。
该研究首次实现船舶故障知识的全自动结构化提取,构建的知识库可直接支持智能决策系统(IDSS)的故障预测推演。相比传统人工解析方式,知识提取效率提升40倍,错误率降低至3%以下。正如论文通讯作者Hui Cao所述:"这项技术让船舶维护从‘故障后抢修’转变为‘知识驱动预防’,每条实体识别结果都是智能航海的重要数据锚点。"未来团队计划将该框架扩展至船舶全生命周期知识图谱构建,为IMO(国际海事组织)倡导的智能航运提供核心技术支撑。
生物通微信公众号
知名企业招聘