-
生物通官微
陪你抓住生命科技
跳动的脉搏
AI聊天机器人作为性传播疾病信息源的可靠性及可读性研究:现状评估与改进方向
《Journal of Medical Systems》:AI Chatbots as Sources of STD Information: A Study on Reliability and Readability
【字体: 大 中 小 】 时间:2025年04月04日 来源:Journal of Medical Systems 3.5
编辑推荐:
本刊推荐:针对公众日益依赖AI chatbots获取敏感健康信息的现状,土耳其研究团队通过DISCERN/EQIP/JAMA/GQS工具评估ChatGPT-4o/Gemini 1.5/Perplexity Pro/Copilot在11项STD查询中的表现。发现Perplexity与Copilot可靠性更优(DISCERN>40),但所有AI生成内容均未达6年级可读性标准(FRES<50,FKGL>8),凸显AI医疗信息需兼顾准确性与通俗化的迫切需求。
在数字化医疗时代,性传播疾病(STD)信息的获取方式正经历革命性变革。由于疾病本身的敏感性,许多患者羞于直面医生,转而向AI聊天机器人寻求帮助——这些24小时在线的"数字医生"能提供即时、匿名的咨询服务。但令人担忧的是,这些AI生成的医疗建议是否准确可靠?普通民众能否真正理解那些充满医学术语的回答?这些问题直接关系到全球每年超百万STD新感染者的健康决策。
为解答这些关键问题,土耳其的研究团队开展了一项开创性研究。通过系统评估四大主流AI聊天机器人(ChatGPT-4o、Gemini 1.5、Perplexity Pro和Copilot)在STD领域的表现,研究揭示了当前AI医疗咨询存在的双重挑战:虽然部分平台已能提供较可靠信息,但所有机器人生成的内容都过于专业复杂,远未达到美国医学会推荐的6年级阅读水平。这项发表在《Journal of Medical Systems》的研究,为AI健康信息服务的发展提供了重要基准。
研究方法
研究团队首先通过Google Trends筛选出2018-2023年间全球最热门的11项STD查询(如"STD症状"、"衣原体治疗"等),采用多维度评估体系:使用DISCERN(医疗信息质量评估工具)、EQIP(患者信息质量量表)、JAMA(学术可信度标准)和GQS(全球质量量表)评估可靠性;采用Flesch-Kincaid Grade Level(FKGL,文本难度分级)等6项指标分析可读性。所有评估由两位具有10年泌尿科临床经验的专家独立完成,并通过Cohen's Kappa系数确保评分一致性。
可靠性分析结果
DISCERN评分显示显著差异(p<0.001),Perplexity(42.27±2.49)和Copilot(41.73±2.2)达到"良好"等级,显著优于ChatGPT(33.27±6.65)和Gemini(38.09±3.05)的"较差"评级。EQIP评估中所有AI均属"存在小问题的良好质量"(51-75%),但Perplexity(59.55±4.99)和Copilot(57.91±4.61)仍领先。值得注意的是,ChatGPT在JAMA基准(评估作者/来源透明度)得分为0,因其完全未提供信息来源。
可读性分析结果
所有AI均未达到6年级阅读标准(p=0.125):Flesch Reading Ease Score(FRES,易读性指数)最佳表现是Gemini(48.27±6.8),远低于80分的推荐值;Flesch-Kincaid Grade Level(FKGL,文本难度对应年级)显示内容难度在8.43(Gemini)至10.34(ChatGPT)年级水平;Gunning Fog Index(GFI,文本复杂度)全部超过11,最高达13.46(ChatGPT)。典型问题如ChatGPT使用"细菌核糖体水平蛋白合成抑制"等专业术语解释衣原体治疗机制。
讨论与意义
该研究首次系统验证了AI聊天机器人在STD领域的"可靠性-可读性悖论":虽然Perplexity和Copilot通过引用来源提升了信息可信度,但所有平台都未能解决内容过于专业化的问题。这在STD防治中尤为关键——低健康素养人群往往正是感染高风险群体。研究者建议AI开发者需建立"双轨优化"机制:既要通过实时连接权威数据库(如CDC指南)提升可靠性,又要开发"通俗化算法"自动简化专业术语。医疗从业者也需警惕AI工具的局限性,在咨询中主动确认患者对线上信息的理解程度。
这项研究为AI健康信息服务树立了重要质量标杆,其方法论同样适用于其他敏感医疗领域。随着欧盟《AI法案》等监管框架出台,该研究强调的透明性(如强制标注信息来源)和可及性(如分级阅读选项)或将成为AI医疗工具的合规标配。未来研究可拓展至多语言环境评估,并探索图像化、交互式等更友好的信息呈现方式。
知名企业招聘
今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号