176阅读
2回复

[智能应用]对21种大语言模型研究表明：AI尚不具备独立临床诊疗的能力 [复制链接]

上一主题下一主题查看指定楼层

在线姜谷粉丝

UID: 1569053

精华: 2
职务: 山庄囚徒
级别: 玉清道君

发帖: 181914

金币: 629274

道行: 20030

原创: 769

奖券: 480

斑龄: 0

道券: 30

获奖: 0

座驾

设备

摄影级

在线时间: 22966(小时)
注册时间: 2012-06-21
最后登录: 2026-05-03

只看楼主倒序阅读楼主发表于: 04-14

— 本帖被兵马大元帅执行加亮操作(2026-04-18) —

用户被禁言,该主题自动屏蔽!

山庄提示：道行不够，道券不够？---☆点此充值☆

在线姜谷粉丝

UID: 1569053

精华: 2
职务: 山庄囚徒
级别: 玉清道君

发帖: 181914

金币: 629274

道行: 20030

原创: 769

奖券: 480

斑龄: 0

道券: 30

获奖: 0

座驾

设备

摄影级

在线时间: 22966(小时)
注册时间: 2012-06-21
最后登录: 2026-05-03

只看该作者沙发发表于: 04-14

申请VIP---在山庄畅通无阻还送FTP单独下载账号!

用户被禁言,该主题自动屏蔽!

如何不发帖就快速得到金币和道行

在线jjybzxw

UID: 551814

精华: 0
职务: 超级斑竹
级别: 得道成仙

发帖: 246207

金币: 896902

道行: 2006

原创: 2465

奖券: 3580

斑龄: 45

道券: 1580

获奖: 0

座驾

设备

摄影级

在线时间: 52323(小时)
注册时间: 2008-10-01
最后登录: 2026-05-03

只看该作者板凳发表于: 04-14

这项研究揭示了人工智能在医疗领域应用的现状和挑战。尽管AI在医疗领域的应用日益增多，但在临床推理方面仍显不足，这表明AI在医疗领域的应用还需要进一步的发展和完善。研究团队通过测试21种大语言模型在29个已发表的临床病例中的表现，发现当获得完整信息时，这些模型在超过90%的案例中能给出正确的最终诊断。然而，研究也指出，AI在早期诊断阶段的表现欠佳，未能提出合理的鉴别诊断，这表明AI在处理信息不充分、需要开放性推理的情境中表现较弱。

此外，研究还强调，当前的大语言模型更擅长在信息完备的情况下给出答案，但在信息不充分、需要开放性推理的情境中表现较弱。团队提出了一种名为PrIME-LLM的新指标，从提出潜在诊断、选择检查手段、给出最终诊断到制定治疗方案等多个环节对模型进行综合评价。结果显示，各模型整体评分在64%至78%之间，表现存在明显差异。

总的来说，这项研究表明，虽然AI在医疗领域的应用有其独特的优势，但在临床推理和独立承担临床诊疗任务方面，AI仍显不足。这提示我们在推广AI在医疗领域应用的同时，也需要保持谨慎，确保其不会替代医生的专业判断和经验。

如何不发帖就快速得到金币和道行

发帖回复

返回列表


	关闭您还没有登录，快捷通道只有在登录后才能使用。立即登录还没有帐号？赶紧注册一个


	关闭选中1篇全选

帖子

[智能应用]对21种大语言模型研究表明：AI尚不具备独立临床诊疗的能力 [复制链接]