TDA-GLM:基于小模型引导 ChatGLM 的水产养殖疾病防控文本数据增强研究 —— 为产业发展筑牢数据根基

【字体: 时间:2025年04月15日 来源:Aquaculture International 2.2

编辑推荐:

  为解决水产养殖疾病防控领域文本数据稀缺、质量参差不齐,直接用大语言模型(LLMs)进行数据增强效果不佳的问题,研究人员开展了 TDA-GLM 小样本数据增强框架的研究。结果显示,该模型在关键指标和样本质量上表现优异,对行业发展意义重大。

  疾病防控对于水产养殖业的健康发展至关重要,高质量的数据是实现智能化疾病管理的基础。然而,该领域的文本数据匮乏且质量不一。直接使用大语言模型(LLMs)进行数据增强往往会产生低质量的输出。在本文中,提出了一种名为 TDA-GLM 的小样本数据增强框架。该框架采用了高质量语料库、预训练大模型和高效提示相结合的策略,通过整合高质量语料库和优化提示技术来改进数据增强。为解决 LLMs 在水产养殖疾病防控中适应性差导致数据增强质量低的问题,引入了监督学习模型。该模型引导对领域知识的理解,并在 LLM 内优化数据增强任务,使得生成的数据既与原始专业材料高度相似,又内容丰富。此外,设计了一个噪声去除模块,通过分析增强数据与数据增强目标之间的一致性来过滤噪声,从而提高增强数据的整体质量。为验证数据增强方法在该领域的可靠性,进行了少样本学习分类任务实验。结果表明,该模型相较于现有的先进文本数据增强技术有显著提升,关键性能指标 Acc、P、R 和 F1分别达到 94.86%、95.55%、94.86% 和 94.62%。在评估增强样本质量的实验中,相似度和丰富度分别达到 94.95% 和 64.41%。这些结果表明,增强样本质量极高,既能保留原始数据的核心语义,又能通过适当变化增加数据多样性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号