
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于连续直觉模糊评估与平均解距离法的人工智能机器人性能比较研究
【字体: 大 中 小 】 时间:2025年08月28日 来源:Engineering Applications of Artificial Intelligence 8
编辑推荐:
本文创新性地提出连续直觉模糊集(CINFUS)框架下的EDAS(基于平均解距离的评估)方法,通过构建非线性隶属度与非隶属度函数(ατ–ατ2)处理决策不确定性,并对ChatGPT、Bard等主流AI机器人进行多维度性能评估(包括用户参与度、客户满意度等指标),为人工智能工具的精准量化比较提供了新范式。
亮点(Highlights)
提出首个基于连续直觉模糊集(CINFUS)的EDAS方法扩展
通过非线性函数ατ–ατ2动态捕捉决策者行为特征
实现对ChatGPT、Bard、Claude等AI机器人的多维度性能对标
文献综述(Literature review)
本节从三个维度梳理研究背景:首先阐释连续直觉模糊集(CINFUS)在决策科学中的演进脉络,其次总结EDAS方法在跨行业应用中的适应性优势,最后系统归纳现有聊天机器人评估方法论的技术特点。
理论基础:连续直觉模糊集(Preliminaries: continuous intuitionistic fuzzy sets)
CINFUS由Alkan与Kahraman(2023a)提出,其核心是通过连续函数F(μC?(x),τ)与F(?C?(x),τ)定义元素在[0,1]区间内的隶属度与非隶属度,其中参数α控制函数取值幅度,τ则表征决策者行为模式的连续变量。该集合满足对称钟形分布特性,显著提升了对不确定性信息的表达能力。
CINFU-EDAS方法论(CINFU-EDAS)
本研究所提方法包含以下步骤:
构建评估体系:定义m个备选方案(AI机器人)与n个评估准则(如用户留存率、线索获取量等)
生成直觉模糊决策矩阵:通过连续函数转化专家评分
计算动态平均解:基于准则权重与τ参数调整
测定正负距离:量化各方案与平均解的偏差
灵敏度分析:验证模型在参数波动下的稳健性
聊天机器人性能评估应用(An application of CINFU-EDAS for chatbot performance assessment)
针对人工智能对话代理(ChatGPT、Bard、Claude等)的爆发式发展,本研究选取八大核心指标:机器人触发量、用户互动率、消息点击率、聊天转接率、用户留存率、跳出率与停留时长、潜在客户捕获量、客户满意度评分(CSAT),通过CINFU-EDAS模型实现量化比较与排名。
结论(Conclusion)
传统精确值决策方法在应对信息缺失和专家意见冲突时存在局限,本研究通过连续直觉模糊建模有效捕捉决策过程中的不确定性光谱。CINFU-EDAS方法不仅为AI工具性能评估提供新范式,其灵活的τ参数机制更适用于生命科学领域复杂决策场景(如临床决策支持系统评估)。
生物通微信公众号
知名企业招聘