AI 追踪 | 医疗保健中的人工智能已到来,但我们并不确定它是否真正帮助患者

医疗保健中的人工智能已到来，但我们并不确定它是否真正帮助患者

来源： MITTR

发表日期： 2026-04-24

中文标题：医疗保健中的人工智能已到来，但我们并不确定它是否真正帮助患者

英文标题： Health-care AI is here. We don’t know if it actually helps patients.

文章链接：无

总结概述

这篇文章提出了一个比“AI 在医疗中是否准确”更关键的问题：这些工具真的改善了患者结局吗？作者指出，AI 已经广泛进入医院和临床环境，从自动记录病历的 AI scribes，到筛查病历、识别高风险患者、解读检查结果与 X 光片的预测和诊断工具，看起来都在快速扩张。许多研究也表明，这些工具在某些任务上很准确，或者确实让医生感觉轻松了不少。

但 Jenna Wiens 和 Anna Goldenberg 在《Nature Medicine》上发表的论文提醒，医疗 AI 不能只看准确率和使用者满意度，更要问它是否真正带来更好的健康结果。AI 可能让胸片分析更快，也可能减轻医生文书负担，但它是否改变临床判断、是否让患者得到更好的治疗、是否改变医学生的信息处理方式、是否引入新的偏差和依赖，这些问题目前都还缺乏足够严谨的评估。文章因此不是反对医疗 AI，而是在呼吁：医疗体系必须从“看上去好用”走向“真正证明对患者有益”。

文章基本事实

•文章指出，AI 已广泛进入医院环境，被用于病历记录、病历筛查、治疗建议、结果解读和影像分析等任务。

•Jenna Wiens（密歇根大学）与 Anna Goldenberg（多伦多大学）在《Nature Medicine》发表论文，质疑医疗 AI 是否真正改善患者结局。

•Wiens 表示，过去十年她一直向临床医生推介 AI，而最近几年医疗系统对这类工具的接受度突然显著提升。

•“Ambient AI” 或 AI scribes 能监听医生与患者的对话并自动转录、总结，目前已被广泛部署。

•早期研究和一线反馈显示，这类工具有助于减轻医生行政负担，并可能缓解职业倦怠。

•但文章强调，目前相关评估更多集中在医生和患者满意度，而不是临床决策变化与最终健康结果。

•2025 年 1 月的一项研究发现，大约 65% 的美国医院已使用 AI 辅助预测工具，但只有约三分之二评估过准确性，更少机构评估过偏差问题。

•Wiens 认为，这些工具未必一定让患者更糟，但很可能并没有医疗机构想象中那么有帮助。

核心观点/意见/看法

✓医疗 AI 不能只凭“准确”“省时”“医生喜欢用”就被视为成功，还必须证明它对患者有实质益处。

✓医疗场景的关键问题不在于模型单点表现，而在于工具如何改变医生判断、流程结构与患者接受治疗的方式。

✓AI scribes 之类工具虽然能减轻文书负担，但也可能悄悄改变医生和医学生处理信息的认知方式。

✓医疗机构在部署 AI 时的评估明显滞后，很多地方甚至连准确性和偏差都还没系统检测，更不用说长期效果。

✓文章的立场并非“别用 AI”，而是“别把采用速度误当成医疗价值已经被证明”。

文章具体内容整理

1) 医疗 AI 正在快速普及，但评估框架没有跟上

•作者开篇承认，AI 已经在医疗体系中无处不在，不再只是实验室里的新鲜概念。

•医生用它记笔记，医院用它筛查病历，系统用它预测支持需求和辅助诊断，扩张速度远快于过去十年。

•但 Wiens 指出，这一波部署速度提升，并不意味着我们已经清楚知道这些工具是否真正对患者有益。

2) “医生觉得方便”不等于“患者结局变好”

•AI scribes 是文章重点举的例子，因为它们的价值看起来最容易被接受：减轻医生文书负担，让医生更专注面对患者。

•早期反馈甚至显示医生对这类工具“喜出望外”，研究也支持它们能减少职业倦怠。

•但作者提醒，满意度与效率提升只是间接指标，真正重要的问题是：它们会不会改变临床决策，以及这种改变是否让患者更好。

3) 准确率高也不自动推出临床价值

•一种 AI 工具就算能更快读懂胸片、预测病程或提出治疗建议，也不代表它一定会改善治疗效果。

•因为模型输出进入现实临床后，还要经过医生采纳、工作流嵌入和人与系统互动等多个环节。

•在这些环节中，工具既可能帮助医生，也可能带来新的依赖、误判或行为变化，而这些后果目前仍缺少系统性证据。

4) 更深层风险是认知方式被工具塑形

•Wiens 提出一个很容易被忽略的问题：长期依赖 AI scribes，是否会改变医生和医学生处理患者信息的方式？

•就像教育研究已经显示某些 AI 工具会影响人类的认知加工路径，医疗环境里的类似变化也值得被认真研究。

•这意味着医疗 AI 的风险不一定表现为“模型答错”，也可能表现为专业人员在长期协作中被重塑的判断习惯。

5) 医疗 AI 需要从部署逻辑转向证据逻辑

•文章引用研究表明，美国已有大批医院在使用 AI 预测工具，但真正进行准确性和偏差评估的比例都还不够高。

•在这种情况下，医疗系统不能只因为工具部署方便、医生反馈积极就默认它们产生了净收益。

•Wiens 的结论是，未来不会是“全 AI”或“零 AI”，而应是建立在更完整证据基础上的中间路线：既利用潜力，也认真评估实际后果。

— END —