乐于分享
好东西不私藏

AI急诊分诊准确率82%,首超人类,哈佛重磅研究意味着什么

AI急诊分诊准确率82%,首超人类,哈佛重磅研究意味着什么

2026年5月1日,全球医学界被一项研究结果震动。

哈佛医学院联合贝斯以色列女执事医疗中心,在国际顶级学术期刊《科学》发表了一项里程碑式研究:OpenAI的o1推理模型,在针对76名真实急诊患者的分诊诊断测试中,准确率达到82%,首次超越了两名人类资深内科医生的79%和70%。

这不是在实验室里做选择题。这是在波士顿医院急诊室,面对真实患者、真实病历、真实压力的双盲对照测试。

研究团队通讯作者、哈佛医学院AI实验室负责人阿琼·曼赖(Arjun Manrai)在新闻发布会上说了一句让医学界深思的话:”我们用几乎所有基准测试了这个AI模型,它超越了此前所有模型和医生基线。”

研究详解:76名患者、三个阶段、双盲对照

研究团队从贝斯以色列女执事医疗中心急诊科,随机选取了76名真实患者病例。测试在三个关键时间节点展开:

第一阶段是急诊分诊阶段,也就是患者刚被推进急诊室的那一刻。此时医生只能看到最基本的电子病历数据——生命体征、人口统计信息,以及护士写的几句主诉。

第二阶段是急诊医生首次接诊阶段。

第三阶段是收治入院或转入ICU阶段。

研究采用了严格的”零预处理”标准——AI模型接收到的电子病历,与人类医生看到的完全一致,都是急诊室里最原始、最混乱、充满缺失项的真实临床数据。

两名评审医生进行了盲评。他们不知道哪个诊断来自AI、哪个来自人类医生。结果令人震惊:一位评审医生在83.6%的情况下选择”分不清”,只有15.2%猜对了来源;另一位更夸张,94.4%选择”分不清”,仅有3.1%猜对。

核心数据对比

初始分诊阶段(信息最少的关键时刻)

据《科学》期刊论文数据,AI(OpenAI o1)的准确率为67%,而两位人类内科主治医生分别是55%和50%。AI领先人类医生12到17个百分点。

入院完善检查后

AI准确率提升至81%至82%,人类医生则提升至70%至79%。虽然这一差距在统计学上不再显著,但AI依然保持领先。

治疗方案制定(最令人震惊的数据)

在另一项测试中,AI与46名医生共同审阅5个复杂临床案例,任务包括设计抗生素使用方案、规划临终关怀流程等长期管理计划。

结果是AI方案得分高达89%,而使用传统搜索引擎等资源辅助的人类医生,得分中位数仅为34%。

差距超过两倍,用”断崖式领先”来形容毫不为过。

研究团队记录了一个典型案例,展示了AI在鉴别诊断方面的惊人能力。

一名患者因肺部血栓症状恶化就诊,人类医生最初判断是抗凝药物治疗失败,准备增加药量。但AI在阅读病史后,注意到患者同时患有红斑狼疮——这是一种自身免疫性疾病,可能引发肺部炎症。基于这一病史关联,AI推断患者可能是自身免疫性肺炎而非单纯的抗凝失败。

后续检查证实了AI的判断完全正确。

研究合著者、哈佛医学院博士生肖恩·巴克利(Thomas Buckley)解释了这个案例的意义:”在信息压缩的急诊场景中,人类医生容易陷入认知偏差或过度保守的陷阱。AI像一个永不疲倦的编译器,能进行高频的医学文献模式匹配。”

阿琼·曼赖在发布会上明确表示:”我不认为我们的发现意味着AI将取代医生,尽管一些销售AI医疗产品的公司可能会这么说。我认为这确实意味着我们正在见证一场深刻的技术变革,它将重塑医学。我们需要现在就评估这项技术,严肃地进行前瞻性临床试验。”

贝斯以色列女执事医疗中心AI项目负责人亚当·罗德曼(Adam Rodman)预测,未来十年将形成”医生、患者与人工智能系统”三方协作的照护模式。

他说:”你可以想象,如果一个系统能被动地运行在电子健康记录上,在诊断错误发生之前就识别出诊断错误和遗漏的诊断机会,这将大大改善医疗质量。”

这对普通人意味着什么

急诊室等待时间可能缩短

对于咱们老百姓来说,这项研究最直接的意义是:以后去急诊,可能不用排那么久的队了。

现在的急诊室普遍面临”过度拥挤”问题。据国家卫健委数据显示,国内三甲医院日均急诊量动辄三四百人次,值班医生人均接诊时间不足8分钟。分诊不准不仅耽误时间,还可能导致真正危急的患者被淹没在人群中。

AI分诊系统可以在患者挂号后几秒钟内完成初步评估,快速识别高风险患者,让真正需要紧急救治的人第一时间得到处理。

误诊漏诊风险降低

研究数据显示,在初始分诊阶段,AI的67%准确率大幅领先人类医生的50%至55%。对于病情复杂、症状不典型的老年患者来说,这意味着被误诊或漏诊的风险可能降低。

特别是在鉴别诊断方面,AI能发现人类医生因经验偏差而忽略的关联。比如前面提到的狼疮病例,如果单靠人类医生的经验判断,很可能按照”抗凝失败”的方向一路走下去。

老年人和慢病患者是最大受益群体

很多老年患者同时患有多种慢性疾病,症状表现往往不典型。一位78岁的老人说”胸口有点闷”,可能是心脏问题,也可能是肺部感染、贫血甚至焦虑情绪。

传统分诊靠护士经验加上患者自述,表述模糊就容易分错科室。据国内数据显示,三甲医院人工分诊准确率仅为70%至80%,基层医院更低。

AI分诊系统可以结合患者年龄、病史、过敏史、家族史等多维度信息综合判断,比任何一位分诊护士掌握的信息都更全面。

其实在国内,AI医疗已经不是”未来”的概念了。

2025年7月,国家卫健委在《关于加快推动AI技术在医疗领域院前和急诊分诊落地应用的提案答复》中明确表示,正在研究制定医疗机构人工智能应用管理规范,加快出台关于促进和规范”人工智能+医疗卫生”应用发展的政策文件。

国家卫健委在《关于政协第十四届全国委员会第三次会议提案答复的函》中提到,已在9个省份27个县(市、区)开展医学人工智能辅助诊疗系统试点。截至2024年,项目实施地区的基层机构通过辅助诊疗系统提供诊断建议近4万人次。

三甲医院落地案例

广州:AI分诊准确率达95%

广州市第一人民医院临床AI医生已于2026年正式试运行,智能分诊准确率高达95%,远超三甲医院人工分诊70%至80%的平均水平。

该系统搭载医疗专用多模态大模型和权威医学知识图谱,学习了上千万份三甲真实病例和专业诊疗指南。

武汉:急诊专用AI终端2分钟完成分诊

华工科技联合同济医院光谷院区研发的”灵智·医疗智能体”已在5家大型三甲医院完成超2万例问诊。

同济医院光谷院区急诊科主任介绍,2026年1月6日单日急诊量突破360人,仅两名医生值守。引入AI系统后,可在2分钟内完成分诊、导诊及结构化病历初稿生成,诊断正确率稳定在90%以上。

湖北:临床验证超93%准确率

湖北省中西医结合医院急诊科护士长反馈,AI系统”提升了分诊准确度,整合了分散的数据资源”,让护理工作从重复劳动中解放。

随机抽取1644份脱敏病历比对显示,预问诊准确率达93%以上,显著高于行业85%的平均水平。

四大局限:AI不是万能的

尽管数据亮眼,我们也要清醒认识到AI分诊的局限性。

局限一:看不到患者的”表情”

研究团队明确指出,这项比较仅限于可被文本化的病历数据层面。AI模型无法获取真实临床中至关重要的非文本信号:患者的痛苦表情、情绪状态、肢体语言,与家属的互动信息,甚至伤口气味等感官线索。

亚当·罗德曼形容得更直白:”AI在此次研究中更像一个辅助性的’第二意见’生成器,而非全能诊断者。”

局限二:弱势群体安全性尚未充分评估

研究论文没有说明AI在哪些类型患者中表现更差。老年患者、非英语母语患者、文化背景特殊的患者群体——这些弱势群体的安全性尚未得到充分评估。

波士顿医院的数据能代表全国急诊的人口结构吗?能代表基层医院和农村地区吗?这个问题没有答案。

局限三:责任归属问题悬而未决

一旦AI给出错误诊断,责任由谁承担?目前不存在正式的问责框架。

如果医生采纳了AI建议而结果出错,责任如何划分?或者更微妙的情况——医生本有正确判断,但被AI带偏了?

这种”责任真空”需要在AI医疗大规模推广前得到解决。

局限四:医生过度依赖的风险

谢菲尔德大学助理教授邢炜提出了一个值得警惕的问题:医生可能对AI产生依赖,弱化独立思考能力。

这并非杞人忧天。自动驾驶领域早有教训:人类监督员对系统过度信任,反应速度反而比纯人工操作更慢。急诊场景下,医生的决策窗口以分钟计,没有慢慢核实AI推理过程的奢侈。

目前AI分诊的正确姿态是”AI初筛+医生把关”。系统负责快速识别高风险患者、提示可能的诊断方向,最终决策权仍在医生手中。

哈佛这项研究最大的意义,不是证明”AI赢了医生”,而是揭示了一个深刻的变化:

医疗决策正在从单一依赖人类经验,向医生、患者与AI系统三方协同的新模式转型。

阿琼·曼赖说:”最终,我认为人类希望由人类来引导他们度过生死抉择,陪伴他们度过充满挑战的治疗,讨论那些影响他们生活质量和能否继续工作的决定。”

AI可以更准、更快地”看到”疾病,但治愈需要的,永远不只是诊断。

医患之间的人文关怀、信任与陪伴,这些是技术永远无法替代的。

但我们也要看到趋势:据美国医学会2026年调查,超过80%的美国医生已在职业中使用AI,是2023年的两倍;约20%的临床医生已经在向大语言模型寻求”第二意见”。

不久的将来,你去急诊,很可能先经过AI初筛——更快、更准、更安全。

技术的温度,终究是服务于人。让我们以开放的心态拥抱变化,同时保持理性的判断。

参考来源

  1. 哈佛医学院研究论文,发表于《科学》期刊,2026年4月30日
  2. Harvard Magazine,2026年4月30日
  3. The Guardian,2026年4月30日
  4. TechCrunch,2026年5月3日
  5. 国家卫健委《关于加快推动AI技术在医疗领域院前和急诊分诊落地应用的提案答复》,2025年7月
  6. 广州市第一人民医院AI医生试点公开报道,2026年4月
  7. 华工科技”灵智·医疗智能体”发布信息,2026年1月