
医疗保健中的人工智能已到来,但我们并不确定它是否真正帮助患者
来源: MITTR
发表日期: 2026-04-24
中文标题: 医疗保健中的人工智能已到来,但我们并不确定它是否真正帮助患者
英文标题: Health-care AI is here. We don’t know if it actually helps patients.
文章链接:无
总结概述
这篇文章提出了一个比“AI 在医疗中是否准确”更关键的问题:这些工具真的改善了患者结局吗?作者指出,AI 已经广泛进入医院和临床环境,从自动记录病历的 AI scribes,到筛查病历、识别高风险患者、解读检查结果与 X 光片的预测和诊断工具,看起来都在快速扩张。许多研究也表明,这些工具在某些任务上很准确,或者确实让医生感觉轻松了不少。
但 Jenna Wiens 和 Anna Goldenberg 在《Nature Medicine》上发表的论文提醒,医疗 AI 不能只看准确率和使用者满意度,更要问它是否真正带来更好的健康结果。AI 可能让胸片分析更快,也可能减轻医生文书负担,但它是否改变临床判断、是否让患者得到更好的治疗、是否改变医学生的信息处理方式、是否引入新的偏差和依赖,这些问题目前都还缺乏足够严谨的评估。文章因此不是反对医疗 AI,而是在呼吁:医疗体系必须从“看上去好用”走向“真正证明对患者有益”。
文章基本事实
•文章指出,AI 已广泛进入医院环境,被用于病历记录、病历筛查、治疗建议、结果解读和影像分析等任务。
•Jenna Wiens(密歇根大学)与 Anna Goldenberg(多伦多大学)在《Nature Medicine》发表论文,质疑医疗 AI 是否真正改善患者结局。
•Wiens 表示,过去十年她一直向临床医生推介 AI,而最近几年医疗系统对这类工具的接受度突然显著提升。
•“Ambient AI” 或 AI scribes 能监听医生与患者的对话并自动转录、总结,目前已被广泛部署。
•早期研究和一线反馈显示,这类工具有助于减轻医生行政负担,并可能缓解职业倦怠。
•但文章强调,目前相关评估更多集中在医生和患者满意度,而不是临床决策变化与最终健康结果。
•2025 年 1 月的一项研究发现,大约 65% 的美国医院已使用 AI 辅助预测工具,但只有约三分之二评估过准确性,更少机构评估过偏差问题。
•Wiens 认为,这些工具未必一定让患者更糟,但很可能并没有医疗机构想象中那么有帮助。
核心观点/意见/看法
✓医疗 AI 不能只凭“准确”“省时”“医生喜欢用”就被视为成功,还必须证明它对患者有实质益处。
✓医疗场景的关键问题不在于模型单点表现,而在于工具如何改变医生判断、流程结构与患者接受治疗的方式。
✓AI scribes 之类工具虽然能减轻文书负担,但也可能悄悄改变医生和医学生处理信息的认知方式。
✓医疗机构在部署 AI 时的评估明显滞后,很多地方甚至连准确性和偏差都还没系统检测,更不用说长期效果。
✓文章的立场并非“别用 AI”,而是“别把采用速度误当成医疗价值已经被证明”。
文章具体内容整理
1) 医疗 AI 正在快速普及,但评估框架没有跟上
•作者开篇承认,AI 已经在医疗体系中无处不在,不再只是实验室里的新鲜概念。
•医生用它记笔记,医院用它筛查病历,系统用它预测支持需求和辅助诊断,扩张速度远快于过去十年。
•但 Wiens 指出,这一波部署速度提升,并不意味着我们已经清楚知道这些工具是否真正对患者有益。
2) “医生觉得方便”不等于“患者结局变好”
•AI scribes 是文章重点举的例子,因为它们的价值看起来最容易被接受:减轻医生文书负担,让医生更专注面对患者。
•早期反馈甚至显示医生对这类工具“喜出望外”,研究也支持它们能减少职业倦怠。
•但作者提醒,满意度与效率提升只是间接指标,真正重要的问题是:它们会不会改变临床决策,以及这种改变是否让患者更好。
3) 准确率高也不自动推出临床价值
•一种 AI 工具就算能更快读懂胸片、预测病程或提出治疗建议,也不代表它一定会改善治疗效果。
•因为模型输出进入现实临床后,还要经过医生采纳、工作流嵌入和人与系统互动等多个环节。
•在这些环节中,工具既可能帮助医生,也可能带来新的依赖、误判或行为变化,而这些后果目前仍缺少系统性证据。
4) 更深层风险是认知方式被工具塑形
•Wiens 提出一个很容易被忽略的问题:长期依赖 AI scribes,是否会改变医生和医学生处理患者信息的方式?
•就像教育研究已经显示某些 AI 工具会影响人类的认知加工路径,医疗环境里的类似变化也值得被认真研究。
•这意味着医疗 AI 的风险不一定表现为“模型答错”,也可能表现为专业人员在长期协作中被重塑的判断习惯。
5) 医疗 AI 需要从部署逻辑转向证据逻辑
•文章引用研究表明,美国已有大批医院在使用 AI 预测工具,但真正进行准确性和偏差评估的比例都还不够高。
•在这种情况下,医疗系统不能只因为工具部署方便、医生反馈积极就默认它们产生了净收益。
•Wiens 的结论是,未来不会是“全 AI”或“零 AI”,而应是建立在更完整证据基础上的中间路线:既利用潜力,也认真评估实际后果。
— END —
夜雨聆风