基于Triaxial Syntactic Fusion Approach的稀疏三元组重叠关系抽取研究

【字体: 时间:2025年09月04日 来源:Knowledge-Based Systems 7.6

编辑推荐:

  【编辑推荐】本研究提出三轴句法融合方法(TSFA),通过最短依赖路径(SDP)构建融合标记集(FSS),结合平面与矩阵注意力机制(TA),有效解决长文本稀疏三元组重叠关系抽取(RE)难题,在NYT/WebNLG等数据集上显著超越基线模型及大语言模型(LLMs)1。

  

Highlight

TSFA通过三轴句法融合创新性地解决了重叠关系抽取(RE)中的语义混淆问题。其核心是通过最短依赖路径(SDP)构建融合标记集(FSS),将不同实体对的SDP标记整合为独特序列,从而捕捉细粒度语义线索。

Proposed Approach: TSFA

如图2所示,TSFA框架包含两大创新:

  1. 1.

    FSS标记集:聚合所有实体对的SDP标记,形成富含语义的融合序列。例如,在"Google→创始人←Sergey Brin"的SDP中,动词"创始人"成为关键关系指示符。

  2. 2.

    三轴注意力(TA)机制

    • 平面注意力:在编码阶段聚焦融合SDP标记

    • 矩阵注意力:预测时建立标记交互矩阵,生成语法相关得分

      这种三维引导策略使模型能同时处理多个重叠实体对的语义交互。

Effectiveness of Flat Attention

图4可视化显示,FSS引导的注意力权重显著集中于SDP关键标记。例如在NYT数据中,"co-founder←Google"路径上的标记获得超过普通标记3倍的注意力权重,验证了语法线索对稀疏三元组的解析优势。

Conclusion

TSFA通过句法驱动的注意力引导机制,在长文本稀疏三元组场景中实现突破性进展。其FSS-TA组合架构为重叠RE提供了新的研究范式,特别适用于低信息密度但语义复杂的生物医学文本分析。

(注:翻译严格遵循了专业术语标注、保留原文结构符号如1,并采用生动表述如"语法线索导航"等生命科学领域常见修辞手法)

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号