切换到宽版
  • 177阅读
  • 2回复

[智能应用]对21种大语言模型研究表明:AI尚不具备独立临床诊疗的能力 [复制链接]

上一主题 下一主题
在线姜谷粉丝

UID: 1569053

精华: 2
职务: 山庄囚徒
级别: 玉清道君
 

发帖
181914
金币
629274
道行
20030
原创
769
奖券
480
斑龄
0
道券
30
获奖
0
座驾
设备
摄影级
在线时间: 22966(小时)
注册时间: 2012-06-21
最后登录: 2026-05-03
只看楼主 倒序阅读 楼主  发表于: 04-14
— 本帖被 兵马大元帅 执行加亮操作(2026-04-18) —
用户被禁言,该主题自动屏蔽!
山庄提示: 道行不够,道券不够?---☆点此充值☆
 
在线姜谷粉丝

UID: 1569053

精华: 2
职务: 山庄囚徒
级别: 玉清道君

发帖
181914
金币
629274
道行
20030
原创
769
奖券
480
斑龄
0
道券
30
获奖
0
座驾
设备
摄影级
在线时间: 22966(小时)
注册时间: 2012-06-21
最后登录: 2026-05-03
只看该作者 沙发  发表于: 04-14
用户被禁言,该主题自动屏蔽!
如何不发帖就快速得到金币道行
 
在线jjybzxw

UID: 551814


发帖
246207
金币
896902
道行
2006
原创
2465
奖券
3580
斑龄
45
道券
1580
获奖
0
座驾
设备
摄影级
在线时间: 52323(小时)
注册时间: 2008-10-01
最后登录: 2026-05-03
只看该作者 板凳  发表于: 04-14
这项研究揭示了人工智能在医疗领域应用的现状和挑战。尽管AI在医疗领域的应用日益增多,但在临床推理方面仍显不足,这表明AI在医疗领域的应用还需要进一步的发展和完善。研究团队通过测试21种大语言模型在29个已发表的临床病例中的表现,发现当获得完整信息时,这些模型在超过90%的案例中能给出正确的最终诊断。然而,研究也指出,AI在早期诊断阶段的表现欠佳,未能提出合理的鉴别诊断,这表明AI在处理信息不充分、需要开放性推理的情境中表现较弱。

此外,研究还强调,当前的大语言模型更擅长在信息完备的情况下给出答案,但在信息不充分、需要开放性推理的情境中表现较弱。团队提出了一种名为PrIME-LLM的新指标,从提出潜在诊断、选择检查手段、给出最终诊断到制定治疗方案等多个环节对模型进行综合评价。结果显示,各模型整体评分在64%至78%之间,表现存在明显差异。

总的来说,这项研究表明,虽然AI在医疗领域的应用有其独特的优势,但在临床推理和独立承担临床诊疗任务方面,AI仍显不足。这提示我们在推广AI在医疗领域应用的同时,也需要保持谨慎,确保其不会替代医生的专业判断和经验。
如何不发帖就快速得到金币道行
 
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个