人工智能助力胃旁路手术：ChatGPT-Omni 表现卓越但仍需验证

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年03月19日 来源：Obesity Surgery 2.9

编辑推荐：

　　研究人员开展 OAGB 相关 AI 模型研究，发现 ChatGPT-Omni 表现更优，为手术决策提供参考。

　　背景：人工智能（AI）融入医疗实践为决策支持开辟新领域，尤其是在像单吻合口胃旁路术（OAGB）这样复杂的外科手术中。本研究旨在展示 ChatGPT-4.0、ChatGPT-Omni 和 Gemini AI 这三种 AI 模型在处理与 OAGB 相关复杂临床问题时的潜力和表现，为更高效的外科手术实践奠定基础。
方法：该研究采用全面的问题评估方法，为 ChatGPT-4.0、ChatGPT-Omni 和 Gemini AI 模型准备了 180 个问题，这些问题平均分为判断题、选择题、开放式问题和病例情景题。问题涵盖了 OAGB 手术的各个方面，包括术前评估、手术技术、并发症管理和长期预后。
结果：在大多数问题格式和难度水平上，ChatGPT-Omni 的准确率高于 Gemini AI 和 ChatGPT-4.0（p＜0.0001）。不过，性能差距因问题的复杂程度和类型而异。在判断题和选择题格式中，ChatGPT-Omni 表现出色，在复杂情景中尤为突出（p=0.017）。在 6 分制评分中，ChatGPT-Omni 在开放式问题和病例情景题上的平均得分为 5.62，展现出提供准确全面答案的卓越能力。ChatGPT-Omni 的性能指标最高，包括精度（0.947）、召回率（0.857）和 F₁分数（0.9），尽管这些值取决于具体的问题格式和类型。
结论：虽然 ChatGPT-Omni 在许多与 OAGB 相关的临床问题中表现出更高的准确性，尤其是在较简单的决策情景中，但强调在复杂临床环境中进行额外验证的必要性至关重要。这一警示提醒人们注意当前 AI 在外科手术中的局限性，以及持续研究和验证的重要性。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号