
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于Triaxial Syntactic Fusion Approach的稀疏三元组重叠关系抽取研究
【字体: 大 中 小 】 时间:2025年09月04日 来源:Knowledge-Based Systems 7.6
编辑推荐:
【编辑推荐】本研究提出三轴句法融合方法(TSFA),通过最短依赖路径(SDP)构建融合标记集(FSS),结合平面与矩阵注意力机制(TA),有效解决长文本稀疏三元组重叠关系抽取(RE)难题,在NYT/WebNLG等数据集上显著超越基线模型及大语言模型(LLMs)1。
Highlight
TSFA通过三轴句法融合创新性地解决了重叠关系抽取(RE)中的语义混淆问题。其核心是通过最短依赖路径(SDP)构建融合标记集(FSS),将不同实体对的SDP标记整合为独特序列,从而捕捉细粒度语义线索。
Proposed Approach: TSFA
如图2所示,TSFA框架包含两大创新:
FSS标记集:聚合所有实体对的SDP标记,形成富含语义的融合序列。例如,在"Google→创始人←Sergey Brin"的SDP中,动词"创始人"成为关键关系指示符。
三轴注意力(TA)机制:
平面注意力:在编码阶段聚焦融合SDP标记
矩阵注意力:预测时建立标记交互矩阵,生成语法相关得分
这种三维引导策略使模型能同时处理多个重叠实体对的语义交互。
Effectiveness of Flat Attention
图4可视化显示,FSS引导的注意力权重显著集中于SDP关键标记。例如在NYT数据中,"co-founder←Google"路径上的标记获得超过普通标记3倍的注意力权重,验证了语法线索对稀疏三元组的解析优势。
Conclusion
TSFA通过句法驱动的注意力引导机制,在长文本稀疏三元组场景中实现突破性进展。其FSS-TA组合架构为重叠RE提供了新的研究范式,特别适用于低信息密度但语义复杂的生物医学文本分析。
(注:翻译严格遵循了专业术语标注、保留原文结构符号如1,并采用生动表述如"语法线索导航"等生命科学领域常见修辞手法)
生物通微信公众号
知名企业招聘