
想象一下这个场景。
你去看医生,说你最近睡不好,有时候心跳得特别快。医生跟你聊了十分钟,问了你最近在吃什么药,有没有过敏史,家里有没有人得过心脏病。
你走了之后,医生对着屏幕说了一段话。AI自动把它整理成病历。
问题来了:AI在病历里写了一款你根本没在吃的降压药。而你对抗生素过敏这件事,AI完全没记进去。
下次你去看另一个医生,他打开你的病历——看到了那款你根本没在吃的药。
这不是虚构的恐怖故事。这是加拿大安大略省审计署刚刚用真实录音测出来的结果。
20个系统,12个搞错了药
5月14日,加拿大安大略省审计总署发布了一份关于省内公共服务使用AI情况的审计报告。其中一个章节专门讲了一个叫"AI Scribe"的项目。
这个项目是安大略省卫生部发起的,目的是让医生、护士用AI来自动记录和整理病历。用过的医生都知道——诊室里对着电脑敲键盘实在太耗时间了,如果AI能听着对话自动出病历,医生就能多看几个病人。
想法是好的。问题是,采购之前总得测一下吧?
审计人员用模拟医患对话的录音,对20家入围供应商的AI系统做了测试。然后请真正的医生把AI生成的笔记和原始录音做对比。
结论是:触目惊心。

20个系统里,12个在病历里写入了错误的药品信息。60%。
9个系统凭空虚构了录音里根本没提过的治疗建议。比如病人根本没说过自己焦虑,AI就在病历里写"患者表现出焦虑症状";检查没发现肿块,AI写"未发现肿块"——这句话本身好像没问题,但你细想:根本没查过的东西,它凭什么说"没发现"?
17个系统遗漏了患者对话里提到的心理健康关键信息。
安大略省有个叫OntarioMD的机构,负责协助医生采购和使用AI Scribe。他们的建议是"医生请手动复核AI笔记的准确性"——但20个系统里,没有一个内置了强制确认机制。
意思就是:全靠医生自觉。而你知道医生有多忙。
整个故事最荒诞的部分
读到这你可能会想:AI不靠谱,这不是新闻。
你说得对。AI在医疗上翻车不是第一次了。斯坦福和哈佛的研究显示,顶级的AI模型每100个临床案例里有12到15个严重错误。还有研究发现大语言模型在约80%的测试病例里做不出正确的鉴别诊断。
但你有没有想过一个更根本的问题:这些不靠谱的系统,当初是怎么被选上的?
答案藏在这份审计报告的评分体系里。

安大略省在评估AI Scribe供应商时,有一个打分表。各项权重是这样的:
• 供应商在安大略省有没有办公室:30% • 病历准确率:4% • 偏见控制:2% • 威胁、风险和隐私评估:2% • SOC 2合规认证:4%
你看出来了吗?
一个AI医疗系统能不能写对病历,只值4分。但它在不在本地有办公室,值30分。
审计报告的原话是:"不准确的权重分配可能导致选择了那些AI工具可能产生不准确或有偏见的医疗记录、或缺乏足够保护来保障敏感个人健康信息的供应商。"
翻译成人话:你选的系统可能记错病历、有偏见、隐私也保护不好,但没关系——它在本地有办公室啊。
5000名医生已经在用了
这才是最让人后背发凉的部分。

安大略省卫生部在报告发布后回应了CBC:全省已经有超过5000名医生在使用AI Scribe系统。卫生部发言人说,目前"没有已知的患者因该技术受到伤害的报告"。
但你仔细品一下这句话。
"没有已知"是什么意思?就是没人报、没人查、或者没人把病历错误和实际伤害联系起来。一个患者吃了AI记错的药导致不良反应——医生会想到去查AI的原始记录吗?大概率不会。这件事就消失在系统里了。
而且,安大略省已经推荐医生手动复核AI笔记——这本身就是在承认系统会出错。但推荐不是强制。忙到飞起的急诊医生,真的一条一条去核对吗?
这不是加拿大一个国家的事
别觉得这事离你很远。

AI医疗笔记不是什么小众实验。微软的Nuance DAX Copilot、谷歌的MedLM、还有各路创业公司,都在全球推销类似的AI病历系统。国内也有企业在做。逻辑都一样:帮医生省时间。
但省时间的代价是什么?如果代价是病历准确率的滑坡,这个交易值不值?
安大略省这次审计最大的贡献,不是揭发了AI会犯错——大家都知道AI会犯错——而是用一份官方文件告诉你:在真实的政府采购里,准确率的重要程度还不如供应商有没有本地办公室。
这个荒诞的排序,才是整个故事里最值得你记住的东西。
因为相同的逻辑,可能正在你所在的城市、你去的医院、你用到的每一个AI系统采购流程里重演。
写在最后
我后来又把那份评分表看了一遍。
准确率4%,本地办公室30%。你几乎能想象那个会议室里的场景:一群官员讨论采购标准,有人提了一句"最重要的当然是记对病历",然后所有人都点头。但到了具体打分的时候——本地就业、产业扶持、税收……这些能写在述职报告里的东西,一项一项加了上去。

最后准确率变成了4%。
AI不会自己决定自己的权重。是人决定的。而人在做决定的时候,想的不一定是你的病历。
评论区聊聊:你去医院的时候,介意医生用AI帮你记病历吗?如果AI记错你的药,你觉得该怪医生、怪AI公司、还是怪采购系统的设计者?
觉得这篇文章值得让更多人看到的话,点个在看,转发给那个经常去医院的朋友。
夜雨聆风