基于 DeepSeek 的水产养殖问答框架中短且高度领域特定文本查询的多维增强及其研究意义
【字体:
大
中
小
】
时间:2025年04月15日
来源:Aquaculture International 2.2
编辑推荐:
为解决水产养殖问答(QA)框架中训练数据稀缺问题,研究人员开展基于 DeepSeek 的多维增强研究。结果显示,DeepSeek 在关键信息识别和意图分类表现出色,且增强样本可靠多样。该研究为疾病管理提供支持,助力 QA 框架发展。
高质量数据对于水产养殖问答(QA)框架中疾病防控的准确及时决策至关重要。然而,反映养殖户与领域专家对话问答交流的文本数据稀缺,阻碍了此类系统的训练与构建。为填补这一空白,研究利用 DeepSeek 进行多维增强,生成适合水产养殖的高质量扩充数据,聚焦于问题端。通过多任务 BERT 框架评估扩充样本的可靠性和多样性,确保保留核心语义并扩大领域数据可用性。与 ChatGPT o1对比,DeepSeek 表现更优。在领域特定关键信息(实体)识别中,准确率达 92.08%,精确率 92.3%,召回率 92.05%,F1分数 91.78%;意图分类中,准确率 91.67%,精确率 93.48%,召回率 91.67%,F1分数 89.68% 。扩充样本领域可靠性强(余弦相似度 < 0.474619),多样性高(Distinct-1 = 0.9776;Self-BLUE = 0.0106)。这表明基于 DeepSeek 的多维文本增强有助于提升水产养殖疾病管理数据的一致性和覆盖度,为 QA 框架后续的答案生成和知识提升奠定基础。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号