UrduAspectNet:结合Transformer和双重GCN进行乌尔都语基于方面的情绪检测

《ACM Transactions on Asian and Low-Resource Language Information Processing》:UrduAspectNet: Fusing Transformers and Dual GCN for Urdu Aspect-Based Sentiment Detection

【字体: 时间:2025年11月08日 来源:ACM Transactions on Asian and Low-Resource Language Information Processing

编辑推荐:

  乌尔都语情感分析中,UrduAspectNet模型通过Stanza库预处理提取POS和词根,结合mBERT和XLM-R两种嵌入对比优化,采用双GCN层处理复杂语法结构,并基于自建4603条多领域新闻标题语料库验证模型效果,在攻克乌尔都语方言和语法的挑战中展现显著性能优势,适用于媒体分析、商业洞察等领域。

  

摘要

乌尔都语以其复杂的形态结构和语言细微差别而著称,在计算情感分析方面面临独特的挑战。为了解决这些问题,我们推出了“UrduAspectNet”——一个专为乌尔都语的基于方面的感情分析(ABSA)设计的模型。我们方法的核心是一个严格的预处理阶段。通过使用Stanza库,我们提取了词性(POS)标签和词元,确保乌尔都语的语言特性得到恰当的表示。为了探究不同嵌入方法的有效性,我们使用mBERT和XLM-R嵌入对模型进行了训练,并比较了它们的性能,以确定最适合乌尔都语ABSA的表示方法。考虑到乌尔都语灵活句法结构中词语之间的微妙关系,我们的模型融入了双图卷积网络(GCN)层。为了解决缺乏专用乌尔都语ABSA数据集的问题,我们自行收集了超过4,603条来自政治、娱乐、商业和体育等领域的新闻标题。这些来自不同新闻平台的标题不仅识别了主要的方面,还确定了它们的情绪极性,分为正面、负面或中性。尽管乌尔都语存在诸如口语表达和习语等固有复杂性,“UrduAspectNet”仍然表现出显著的效能。将mBERT和XLM-R嵌入与双GCN结合后的初步比较,为它们在乌尔都语ABSA领域的优势提供了宝贵的见解。“UrduAspectNet”在媒体分析、商业洞察和社会文化分析等广泛应用中具有重要地位,被视为乌尔都语ABSA研究中的一个关键基准。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号