人工智能助力胃旁路手术:ChatGPT-Omni 表现卓越但仍需验证

【字体: 时间:2025年03月19日 来源:Obesity Surgery 2.9

编辑推荐:

  研究人员开展 OAGB 相关 AI 模型研究,发现 ChatGPT-Omni 表现更优,为手术决策提供参考。

  背景:人工智能(AI)融入医疗实践为决策支持开辟新领域,尤其是在像单吻合口胃旁路术(OAGB)这样复杂的外科手术中。本研究旨在展示 ChatGPT-4.0、ChatGPT-Omni 和 Gemini AI 这三种 AI 模型在处理与 OAGB 相关复杂临床问题时的潜力和表现,为更高效的外科手术实践奠定基础。
方法:该研究采用全面的问题评估方法,为 ChatGPT-4.0、ChatGPT-Omni 和 Gemini AI 模型准备了 180 个问题,这些问题平均分为判断题、选择题、开放式问题和病例情景题。问题涵盖了 OAGB 手术的各个方面,包括术前评估、手术技术、并发症管理和长期预后。
结果:在大多数问题格式和难度水平上,ChatGPT-Omni 的准确率高于 Gemini AI 和 ChatGPT-4.0(p<0.0001)。不过,性能差距因问题的复杂程度和类型而异。在判断题和选择题格式中,ChatGPT-Omni 表现出色,在复杂情景中尤为突出(p=0.017)。在 6 分制评分中,ChatGPT-Omni 在开放式问题和病例情景题上的平均得分为 5.62,展现出提供准确全面答案的卓越能力。ChatGPT-Omni 的性能指标最高,包括精度(0.947)、召回率(0.857)和 F1分数(0.9),尽管这些值取决于具体的问题格式和类型。
结论:虽然 ChatGPT-Omni 在许多与 OAGB 相关的临床问题中表现出更高的准确性,尤其是在较简单的决策情景中,但强调在复杂临床环境中进行额外验证的必要性至关重要。这一警示提醒人们注意当前 AI 在外科手术中的局限性,以及持续研究和验证的重要性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号