牛津大学最新研究:大模型诊断医疗案例准确率达94.9%
创始人
2025-07-01 12:02:32

【CNMO科技消息】近日,牛津大学的一项研究发现,大型语言模型正确诊断医疗案例的准确率达到了94.9%。这比许多医生都要高。然而,当普通人使用相同的AI工具处理相同的情况时,其准确率下降到仅34.5%。原因是:AI并不是性能的限制因素,真正可能阻碍AI发挥其全部潜力的是我们人类。

CNMO从外媒获悉,由亚当·马迪博士领导的研究吸引了近1300名参与者参与,每个人都会收到一个详细的病例情景,包括症状、病史和个人背景。研究的目的是看普通人能否使用人工智能来判断问题所在,并决定寻求什么类型的治疗方式。

参与者要将AI视为真正的医生,提问、描述症状并获得帮助。研究人员在实验中使用了三种不同的大型语言模型,分别是:ChatGPT-4o、Llama 3和Command R+。

研究人员发现,使用大型语言模型的参与者在34.5%的案例中至少能识别出一个相关条件;完全不使用AI的对照组表现更好,达到了47%;而在选择正确行动方案时,大型语言模型用户只有44.2%的概率能答对;当AI模型独自决定时,正确率为56.3%。

问题在于:有些人提供的信息不完整或不清楚;有些人忘记提及关键症状;有些人则是遗漏了严重程度或时间点。导致AI误解或错过了重要线索。即使人工智能给出了正确的诊断,用户也不一定执行,这部分不是机器所特有的,人们也会忽视医生的建议。

据CNMO了解,一些AI工具已经在实际的医疗流程中获得了关注。例如,OpenEvidence被医生用来搜索和验证临床文献。它不是用来取代医生,而是增强他们的能力。

相关内容

热门资讯

梦幻西游冯总讲述第一谛听交易细... 梦幻西游珍宝阁“第一谛听”流出团队一事引发广泛关注,部分粉丝质疑团队无人接手。随着讨论不断升温,团队...
警惕!个别致癌物超标!这种一次... 近些年,可降解一次性杯子由于环保、洁净的理念,呈现出快速增长的消费趋势。但有消费者反映,市场上一次性...
隆泰迪取得高速激光熔覆设备专利... 国家知识产权局信息显示,沧州隆泰迪管道科技有限公司取得一项名为“一种高速激光熔覆设备”的专利,授权公...
梦幻西游全服第一16技能谛听成... 自梦幻西游大佬高总宣布暂别赛场后,其手下的两只神兽去向便备受关注。据悉,高总那只全服独一无二的16技...
《失落星船:马拉松》试玩报告:... “欢迎来到天仓五Ⅳ。” 时隔大半年,我再次见到了《失落星船:马拉松》。 我在前几日有幸前往线下,参加...