网站首页 全球最实用的IT互联网站!

人工智能P2P分享Wind搜索发布信息网站地图标签大全

当前位置:诺佳网 > 互联网 > 探索 >

AI尚不具备独立临床诊疗的能力

时间:2026-04-15 00:00

人气:

作者:admin

标签:

导读:AI尚不具备独立临床诊疗的能力-团队指出,大语言模型更擅长在信息完备的情况下“给出答案”,但在信息不充分、需要开放性推理的情境中表现较弱。...

  科技日报北京4月13日电(记者张佳欣)尽管人工智能(AI)在医疗领域的应用日益增多,但其“像医生一样思考”的能力仍存在明显短板。由美国麻省总医院MESH孵化器团队开展的一项最新研究发现,生成式AI在临床推理关键环节仍显不足,尚不具备独立承担临床诊疗任务的能力。相关成果发表在最新一期《JAMA Network Open》上。

  团队选取包括ChatGPT、DeepSeek、Claude、Gemini和Grok在内的21种大语言模型,在29个已发表的临床病例中进行测试,并通过逐步提供患者信息(从基本症状到实验室和影像结果)来模拟真实诊疗过程。结果显示,当获得完整信息时,所有模型在超过90%的案例中能给出正确的最终诊断。

  然而,在关键的早期诊断阶段,这些模型普遍表现欠佳。研究发现,超过80%的情况下,模型未能提出合理的“鉴别诊断”,即对多种可能疾病进行系统性分析与筛选。这一能力被认为是临床推理的核心,也是医生决策的重要基础。

  为更全面评估模型能力,团队提出了一种名为PrIME-LLM的新指标,从提出潜在诊断、选择检查手段、给出最终诊断到制定治疗方案等多个环节对模型进行综合评价。结果显示,各模型整体评分在64%至78%之间,表现存在明显差异。

  团队指出,大语言模型更擅长在信息完备的情况下“给出答案”,但在信息不充分、需要开放性推理的情境中表现较弱。随着实验室数据和影像资料的加入,模型表现有所提升,且新一代模型整体优于旧版本,表明相关技术正在持续改进。

  团队表示,当前大语言模型尚不适合在缺乏监督的情况下直接用于临床实践,其价值更在于辅助医生决策,而非取而代之。

温馨提示:以上内容整理于网络,仅供参考,如果对您有帮助,留下您的阅读感言吧!
相关阅读
本类排行
相关标签
本类推荐

CPU | 内存 | 硬盘 | 显卡 | 显示器 | 主板 | 电源 | 键鼠 | 网站地图

Copyright © 2025-2035 诺佳网 版权所有 备案号:赣ICP备2025066733号
本站资料均来源互联网收集整理,作品版权归作者所有,如果侵犯了您的版权,请跟我们联系。

关注微信