
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于GPT-4 Turbo的韩国儿童癌症幸存者问答数据集构建与验证:面向信息支持与情感关怀的智能辅助系统研究
【字体: 大 中 小 】 时间:2025年09月01日 来源:Expert Systems with Applications 7.5
编辑推荐:
韩国儿童癌症幸存者面临心理与信息支持缺口,研究团队通过整合GPT-4 Turbo生成回答、专家评估(11名专家评分4.98/6)及关系知识图谱(RKG,幻觉检测性能0.979),构建含3,876对问答的KCCSQA数据集。14名幸存者试点验证显示系统满意度达4.36/6,为AI驱动的精准医疗支持提供新范式。
儿童癌症幸存者虽因医疗进步生存率提升(韩国5年生存率从64.3%升至86.1%),却长期面临心理创伤、社会歧视及碎片化医疗支持的困境。尤其韩国缺乏整合性支持系统,幸存者常因隐私顾虑回避求助,导致信息与情感需求未被满足。传统网络信息鱼龙混杂,专业资源获取门槛高。如何构建既精准又具共情的支持工具?Kyunbum Hwang团队在《Expert Systems with Applications》发表的研究给出了AI驱动的解决方案。
研究团队采用多阶段技术路线:1) 通过在线调查(119名幸存者)、学术文献和网站收集3,500个问题,经KLUE/RoBERTa模型分析证实幸存者真实提问与文献问题存在分布差异;2) 利用GPT-4 Turbo生成回答,结合专家编写的少量示例进行少样本学习(few-shot learning)优化;3) 构建关系知识图谱(RKG,含43,475节点)检测生成内容中的幻觉(如机构名称错误);4) 采用伪评分系统(pseudo-scoring)自动评估回答质量,低分答案重新生成;5) 通过专家评审(11人)和幸存者试点(14人)验证效果。
研究结果
数据收集与分布差异
在线调查显示88.2%幸存者愿使用聊天机器人,68.9%侧重获取信息。t-SNE可视化证实幸存者提问(红色聚类)与文献问题(蓝色)存在显著差异,凸显直接采集用户需求的重要性。
GPT-4 Turbo生成优化
专家评分显示GPT回答在整体质量(4.98/6)、事实准确性等方面均优于现有答案。少样本学习使回答更贴近专家风格,如"放疗副作用"回答中高亮句与专家表述高度一致。
质量增强技术
RKG成功识别87条幻觉信息(如虚构机构名),检测率达97.9%。伪评分将3,500条回答分类为15条"差"、180条"中"和3,305条"优",差评答案经再生后质量提升。
试点验证
幸存者对聊天机器人的满意度达4.36/6(6分制),所有参与者表示愿重复使用。新增的376个问题被纳入最终数据集,总量达3,876对。
结论与意义
该研究首创面向韩国儿童癌症幸存者的综合问答数据集KCCSQA,通过AI生成与专家验证的结合,解决了传统支持系统信息分散、缺乏共情的问题。技术层面,RKG和伪评分系统为医疗领域AI的可靠性控制提供新思路。尽管存在专家样本量有限、RKG构建耗时等局限,但试点结果证实了系统的实用价值。未来可扩展至其他语种或癌症类型,推动AI在精准医疗支持中的应用边界。
(注:全文数据与结论均源自原文,专业术语如KLUE/RoBERTa、t-SNE等保留原格式,技术方法描述严格对应论文流程)
生物通微信公众号
知名企业招聘