编辑推荐:
大语言模型(LLMs)在医疗应用中日益重要,但像 GPT-4o 这类专有模型因无法在医疗机构本地部署,难以满足隐私法规要求。研究人员开展 DeepSeek-V3 和 DeepSeek-R1 在临床决策支持任务中的性能研究,发现其表现与专有模型相当甚至更优,为医疗应用提供新途径。
大语言模型(Large Language Models,LLMs)正逐渐改变医疗应用领域的格局。然而,诸如 GPT-4o 这类专有模型在临床应用方面面临巨大阻碍,因其无法在医疗机构内部进行本地部署,不符合严格的隐私法规要求。近期,像 DeepSeek 模型这样的开源大语言模型取得了新进展,为解决这一问题带来了希望。借助先进的信息技术基础设施,DeepSeek 模型能够在医院本地数据上进行高效微调。
为了验证 DeepSeek-V3 和 DeepSeek-R1 的临床实用性,研究人员将它们在临床决策支持任务中的表现,与包括 GPT-4o 和 Gemini-2.0 Flash Thinking Experimental 在内的专有大语言模型进行了对比评估。研究选取了 125 个具有足够统计效力的患者病例,涵盖了广泛的常见疾病和罕见病。结果发现,DeepSeek 模型的表现与专有大语言模型相当,在某些情况下甚至更胜一筹。
这项研究表明,开源大语言模型能够为安全的模型训练提供可扩展的途径,使真实世界的医疗应用符合数据隐私和医疗法规要求,为医疗领域的发展开辟了新的道路。