评估人工智能聊天机器人在心血管成像患者教育中的准确性与可靠性:ChatGPT、Gemini 和 Copilot 的对比研究
心血管疾病是全球主要死因,心血管成像对诊疗至关重要,患者常从 AI 聊天机器人获取相关信息,但信息可靠性存疑。研究人员评估 ChatGPT、Gemini 和 Copilot 在回答患者心血管成像问题上的准确性和可靠性,发现 ChatGPT<sub>4</sub>表现最佳,为 AI 在临床应用提供参考。
来源:Egyptian Journal of Radiology and Nuclear Medicine 0.7
时间:2025-03-28
新的人工智能工具比最先进的方法更快地生成高质量的图像
麻省理工学院和英伟达的研究人员开发了一种混合人工智能方法,可以生成与最先进的扩散模型质量相同或更好的逼真图像,但运行速度快9倍,使用的计算资源更少。该工具使用自回归模型快速捕获大图,然后使用小扩散模型来细化图像的细节。
急诊科诊断新视角:ChatGPT模型迭代的初步评估及其临床效能比较
急诊科(ED)诊断面临高压力与复杂性挑战,本研究针对ChatGPT不同迭代模型(GPT-3.5/4/4o/o1)在30例真实急诊病例中的诊断性能开展系统评估。研究发现:1) GPT-4o-latest和o1-preview对首要诊断准确率提升至60%(p<0.01);2) 要求模型展示推理过程("thoughts")可使4o系列诊断准确率提升5.6-11.1%(p=0.03-0.04);3) 非典型临床表现(如无发热肺炎)仍是模型主要局限。该研究为AI辅助急诊决策提供了版本选择与提示工程的重要实证依据。
来源:Scientific Reports 3.8
时间:2025-03-27
LLMs 在医学教育中的准确性:与医学教师一致性测试的证据 —— 探寻 AI 辅助医学教育的可靠之路
为评估生成式人工智能(Generative AI)在医学教育中应用的准确性,保障患者安全,研究人员开展了关于 ChatGPT、Gemini 和 Copilot 回答医学选择题(MCQs)准确性的研究。结果显示 ChatGPT 准确性最高(70%),但 LLMs 整体准确性与医学教师相比仍较低,该研究为 LLMs 在医学教育中的应用提供重要参考。
来源:BMC Medical Education 2.7
时间:2025-03-27
大语言模型在脊髓损伤(SCI)领域的表现大揭秘:谁才是 “最强辅助”?
为解决脊髓损伤(SCI)患者获取医学信息的问题,研究人员开展了对 ChatGPT-4o、Claude-3.5 sonnet、Gemini-1.5 Pro 和 Llama-3.1 四个大语言模型(LLMs)的研究。结果显示各模型表现有差异,Gemini 信息质量高,ChatGPT 准确性和综合性强。该研究首次系统比较,意义重大。
来源:Journal of Medical Systems 3.5
时间:2025-03-26
生成式人工智能在精神科教育中的作用:潜力与挑战并存
为探究 GenAI 在精神科教育中的作用,研究人员开展相关研究,发现其有应用潜力但存局限,对精神科教育意义重大。
来源:BMC Medical Education 2.7
时间:2025-03-26
《自然与人工智能的批判性比较:洞察智能领域的关键差异与发展意义
在人工智能(AI)部分应用达 “超人” 水平的当下,研究人员开展 “自然与人工智能的批判性比较” 研究。该书涵盖智能能力及过程的基础方面,为有知识储备者提供全面视角,但对新手较难理解。其意义在于推动相关领域研究发展。
来源:BIOspektrum
时间:2025-03-26
人工智能如何重塑法医学:潜力、挑战与意义
为解决法医学中人工智能(AI)应用的相关问题,研究人员开展 AI 在法医学应用的研究,发现其有潜力但需审慎评估,意义重大。
来源:Rechtsmedizin 0.4
时间:2025-03-26
大语言模型(LLMs)在放射学中的应用:机遇与局限 —— 深度洞察医学影像领域的创新变革
为探究 LLMs 在放射学中的作用,研究人员分析其应用多方面,发现其有局限,对医学影像研究意义重大。
来源:Die Radiologie 0.7
时间:2025-03-26
N1C VARIANT 指南:开启罕见遗传病反义寡核苷酸(ASO)精准治疗新时代
本文介绍 N1C VARIANT 指南,助评估致病 DNA 变异对 ASO 治疗的适用性,推动罕见病精准治疗。
来源:AJHG 9.8
时间:2025-03-26