ChatGPT-4o 在牙髓病诊断中的卓越表现：挑战传统，重塑口腔医学教育格局

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《BMC Oral Health》：Comparing diagnostic skills in endodontic cases: dental students versus ChatGPT-4o

【字体：大中小】 时间：2025年03月30日 来源：BMC Oral Health 2.6

编辑推荐：

　　在人工智能（AI）广泛应用于医疗领域的背景下，为探究 ChatGPT-4o 在牙髓病诊断中的准确性，马尔马拉大学研究人员对比了其与牙科学生的诊断能力。结果显示 ChatGPT-4o 准确率更高，这对口腔医学教育及临床决策意义重大。

娑撹桨绨℃穱鍐箻缁夋垵顒熼惃鍕炊閹绢叏绱濋悽鐔哄⒖闁岸鍣伴梿鍡曠啊鏉╂瑧鐦掗弬鍥╃彿閿涘苯顩ч棁鈧懟杈ㄦ瀮閸樼喐鏋冮敍宀冾嚞閻愮懓鍤敍锟�鐠併垽妲凚ioHot缁便垹褰囬崢鐔告瀮

　　在科技飞速发展的当下，人工智能（AI）已渗透到众多领域，医疗行业也不例外。在牙科领域，AI 技术正逐渐改变着传统的诊疗模式和教育方式。然而，牙髓病作为口腔医学中重要的分支，其诊断和治疗一直面临着诸多挑战。一方面，传统的诊断方法依赖于医生的经验和专业知识，不同医生之间的诊断准确性可能存在较大差异；另一方面，随着患者对口腔健康需求的不断提高，对牙髓病诊断的准确性和效率也提出了更高的要求。在此背景下，探究如何利用 AI 技术提升牙髓病诊断水平成为了口腔医学领域的重要课题。

为了解决这些问题，马尔马拉大学（Marmara University）的研究人员 Parla Meva Durmazpinar 和 Ece Ekmekci 开展了一项关于 “Comparing diagnostic skills in endodontic cases: dental students versus ChatGPT-4o” 的研究。该研究旨在评估 ChatGPT-4o 在牙髓病诊断中的准确性，并与牙科学生的表现进行对比。

研究人员选取了两组牙科学生，分别为三年级和五年级学生，同时引入 ChatGPT-4o 参与诊断测试。研究过程中，研究人员准备了 15 道基于患者病史、全景和根尖周 X 光片以及临床照片的多项选择题，这些题目依据美国牙髓病学家协会（American Association of Endodontists，AAE）的临床指南制定。通过 Google Forms 将题目发放给学生，同时研究人员向 ChatGPT-4o 提出同样的问题 75 次。之后，研究人员根据 AAE 的临床牙髓病指南评估所有参与者的回答，将学生的回答分为正确（C）、错误（I）或未回答（U），ChatGPT-4o 的回答也依据相同标准进行评估。

研究结果显示，ChatGPT-4o 的正确回答率为 91.4%，错误率为 8.2%，未回答率为 0.4%；三年级学生的正确回答率为 60.8%，错误率为 32.9%，未回答率为 6.3%；五年级学生的正确回答率为 79.5%，错误率为 18.5%，未回答率为 2%。通过统计学分析发现，研究组之间的正确回答率存在显著差异（span data-custom-copy-text="\(p0.05\)"），ChatGPT-4o 的表现优于两组学生（span data-custom-copy-text="\(p0.001\)"），且五年级学生的正确回答率高于三年级学生。

这一研究结果意义重大。对于口腔医学教育而言，ChatGPT-4o 展现出了作为诊断支持工具的巨大潜力，其高诊断准确性和一致性为临床培训和决策提供了新的思路和方法，有助于提升牙科学生的诊断能力和临床实践水平。同时，该研究也为 AI 技术在牙髓病诊断领域的进一步应用奠定了基础，推动了口腔医学的数字化发展。

楠炲灝鎲� 请留言您与赛默飞离子色谱故事、您对赛默飞离子色谱的使用感受、您希望未来离子色谱可实现的创新方向。均有机会获得限量版 Inuvion颗粒积木一份，您可能是全球为数不多拥有该积木的幸运儿！

研究人员为开展这项研究，运用了多种关键技术方法。在样本选取方面，选取了马尔马拉大学牙科学院的三年级和五年级学生作为研究对象。在数据收集阶段，通过 Google Forms 收集学生的回答数据，同时多次向 ChatGPT-4o 提出问题获取其回答。数据分析时，运用 IBM SPSS 25 软件进行统计分析，包括计算描述性统计数据、评估数据分布的正态性、进行组间比较等。

研究结果部分：

不同参与者的诊断准确性比较：通过对参与者回答的分类统计，发现 ChatGPT-4o 的正确回答率远高于三年级和五年级学生，五年级学生的正确回答率又高于三年级学生。这表明 ChatGPT-4o 在牙髓病诊断方面具有较高的准确性，且学生的诊断准确性随着年级增长而提高。
组间差异的统计学分析：利用 Kruskal-Wallis 检验和 Bonferroni 事后检验，证实了不同组之间在正确回答率上存在显著差异。ChatGPT-4o 在准确性上明显优于学生，进一步说明了其在牙髓病诊断中的优势。
学生诊断一致性分析：通过 Fleiss’ Kappa 分析评估学生之间的诊断一致性，发现三年级学生和五年级学生分别呈现出中等和中等 - 良好水平的一致性，这意味着随着临床教育的推进，学生的诊断方法逐渐趋于系统，但个体差异依然存在。

研究结论和讨论部分，该研究充分证实了 ChatGPT-4o 在牙髓病诊断方面相较于牙科学生具有更高的准确性和一致性。这一结果不仅为 AI 技术在口腔医学教育中的应用提供了有力支持，也为未来的研究指明了方向。未来的研究可以进一步拓展样本量，涵盖更复杂多样的临床场景，同时探索如何通过标准化的评估方法提升学生的诊断能力，以及如何更好地将 AI 技术融入到牙髓病的诊断和治疗过程中。总之，这项研究为口腔医学领域的发展带来了新的契机，有望推动口腔医学教育和临床实践的变革。

娑撳娴囩€瑰宓庢导锔炬暩鐎涙劒鍔熼妴濠団偓姘崇箖缂佸棜鍎禒锝堥樋閹活厾銇氶弬鎵畱閼筋垳澧块棃鍓佸仯閵嗗甯扮槐銏狀洤娴ｆ洟鈧俺绻冩禒锝堥樋閸掑棙鐎芥穱鍐箻閹劎娈戦懡顖滃⒖閸欐垹骞囬惍鏃傗敀

10x Genomics閺傛澘鎼isium HD 瀵偓閸氼垰宕熺紒鍡氬劒閸掑棜椴搁悳鍥╂畱閸忋劏娴嗚ぐ鏇犵矋缁屾椽妫块崚鍡樼€介敍锟�

濞嗐垼绻嬫稉瀣祰Twist閵嗗﹣绗夐弬顓炲綁閸栨牜娈慍RISPR缁涙盯鈧鐗哥仦鈧妴瀣暩鐎涙劒鍔�

閸楁洜绮忛懗鐐寸ゴ鎼村繐鍙嗛梻銊ャ亣鐠佹彃鐖� - 濞ｅ崬鍙嗘禍鍡毿掓禒搴ｎ儑娑撯偓娑擃亜宕熺紒鍡氬劒鐎圭偤鐛欑拋鎹愵吀閸掔増鏆熼幑顔垮窛閹貉傜瑢閸欘垵顫嬮崠鏍掗弸锟�

娑撳娴囬妴濠勭矎閼崇偛鍞撮摂瀣鐠愩劋绨版担婊冨瀻閺嬫劖鏌熷▔鏇犳暩鐎涙劒鍔熼妴锟�