多模态大语言模型:助力激光视力矫正安全性评估与禁忌证预测的新利器

【字体: 时间:2025年02月04日 来源:npj Digital Medicine 12.4

编辑推荐:

  在激光视力矫正手术中,安全指标计算繁琐且现有 AI 工具难融入临床评估。研究人员开展多模态大语言模型(LLMs)用于激光视力矫正安全性评估的研究,发现 ChatGPT-4 计算准确、能预测禁忌证,为临床决策提供支持。

  在当今科技飞速发展的时代,眼科领域的激光视力矫正手术为众多近视患者带来了清晰世界的希望。然而,手术安全却像一把高悬的达摩克利斯之剑,时刻牵动着医生和患者的心。传统的激光视力矫正安全性评估指标,如残余基质床厚度(RSB)、组织消融百分比(PTA)以及 Randleman 扩张风险评分系统(ERSS) ,虽然对判断手术风险至关重要,但手动计算这些指标不仅耗时费力,还容易受到人为因素的干扰。而且,对于复杂的角膜地形图等非结构化数据,传统机器学习(ML)方法常常力不从心,难以有效处理。此外,现有的 AI 工具由于其复杂性和不友好的用户界面,很难被临床医生融入到日常的手术评估流程中,这使得手术风险评估难以做到全面、精准。
为了解决这些棘手的问题,来自韩国延世大学(Yonsei University)等机构的研究人员开展了一项关于多模态大语言模型(LLMs)在激光视力矫正安全性指标计算和禁忌证预测方面应用的研究。该研究成果发表在《npj Digital Medicine》上,为眼科手术安全评估领域带来了新的曙光。

研究人员采用了多种关键技术方法。首先,收集了 2022 年 4 月至 6 月期间 B&VIIT 眼科中心的患者数据,这些数据涵盖了接受激光原位角膜磨镶术(LASIK)或准分子激光角膜切削术(PRK)矫正近视的患者,以及因禁忌证不适合手术的患者。所有患者术前均进行了 Pentacam Scheimpflug 设备测量,获取了包括明显屈光、角膜断层扫描和中央角膜厚度等数据。然后,研究人员将患者相关信息输入 ChatGPT-4,利用光学字符识别(OCR)技术让其自动处理数据,并计算各项安全指标。同时,将 ChatGPT-4 的计算结果与专家手动计算值、Gemini Advance 系统和 LLAMA-3 的输出进行对比。此外,还通过对比 ChatGPT-4 与传统 ML 模型对 LASIK 手术候选者的筛选能力,评估其在预测角膜激光手术禁忌证方面的表现。

研究结果


  1. 安全指标计算准确性:ChatGPT-4 成功处理了所有患者的眼部数据,无需事先知晓单位信息就能准确推断每个参数的单位。其计算的消融深度、RSB、PTA 和 ERSS 值与专家手动计算结果高度匹配。在对 68 例近视患者的 136 只眼和 32 例禁忌证患者的 64 只眼的数据计算中,与手动计算相比,ChatGPT-4 计算的各项指标均无显著统计学差异。而 LLAMA-3 在数值运算中频繁出错,与手动计算结果存在较大差异。
  2. 计算器生成能力:ChatGPT-4 能够根据提示指令生成基于超文本标记语言(HTML)的屈光手术指标计算器。该计算器与所有操作系统兼容,且代码完整提供,各视力矫正中心还可通过定制提示进一步优化,以满足特定临床需求。相比之下,Gemini Advance 在 ERSS 公式计算中频繁出现幻觉,导致生成的计算器不准确。
  3. 禁忌证预测性能:ChatGPT-4 在预测角膜激光手术禁忌证方面表现出色。它能有效分析角膜地形图图像,准确检测早期圆锥角膜或亚临床扩张。通过 ROC 曲线评估,ChatGPT-4 的曲线下面积(AUC)达到 0.977,显著高于 ML 集成模型(AUC = 0.930)、ERSS(AUC = 0.788)和 PTA(AUC = 0.897) 。其敏感性为 98.4%,特异性为 97.1%,且数据输入时间明显短于 ML 集成模型。虽然 ChatGPT-4 的平均计算时间(27.02 秒)长于 ML 集成模型(1.83 秒)和 ERSS(即时),但其高准确性和详细的结果解释使其成为临床决策的可行工具。
  4. 模态无关分析能力验证:研究人员利用公开文献中的数据进一步验证 ChatGPT-4 的模态无关分析能力。结果显示,ChatGPT-4 能够成功分析来自 Pentacam、CASIA2、NIDEK OPD III、RTVue 和 Galilei G4 等多种设备的角膜测量数据,准确诊断出圆锥角膜这一手术禁忌证。

研究结论与讨论


该研究表明,多模态 LLM(如 ChatGPT-4)在激光视力矫正安全指标计算和禁忌证预测方面具有巨大潜力。与传统 ML 系统相比,ChatGPT-4 在处理非结构化数据和分析手术候选者方面表现更优,计算准确且能提供可解释的结果,还能生成临床实用的计算器。虽然它存在计算时间较长、训练未优先考虑医学准确性以及使用成本高等局限性,但依然为临床医生提供了便利的工具,有助于更全面地评估手术风险。

这一研究成果意义重大,为激光视力矫正手术的安全性评估提供了新的思路和方法。它有望在未来广泛应用于眼科临床实践,提高手术安全性和精准度,让更多患者受益。然而,目前研究存在回顾性设计、未在多中心验证等局限性,未来需要开展前瞻性、多中心的研究,进一步验证和拓展这些发现。同时,探索使用开源或轻量级 LLMs,以及对现有模型进行医学数据集微调,将有助于解决成本和准确性问题,推动 AI 技术在医学领域的深入应用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号