AI急诊分诊准确率82%,首超人类,哈佛重磅研究意味着什么-夜雨聆风

AI急诊分诊准确率82%,首超人类,哈佛重磅研究意味着什么

2026年5月1日，全球医学界被一项研究结果震动。

哈佛医学院联合贝斯以色列女执事医疗中心，在国际顶级学术期刊《科学》发表了一项里程碑式研究：OpenAI的o1推理模型，在针对76名真实急诊患者的分诊诊断测试中，准确率达到82%，首次超越了两名人类资深内科医生的79%和70%。

这不是在实验室里做选择题。这是在波士顿医院急诊室，面对真实患者、真实病历、真实压力的双盲对照测试。

研究团队通讯作者、哈佛医学院AI实验室负责人阿琼·曼赖（Arjun Manrai）在新闻发布会上说了一句让医学界深思的话：”我们用几乎所有基准测试了这个AI模型，它超越了此前所有模型和医生基线。”

研究详解：76名患者、三个阶段、双盲对照

研究团队从贝斯以色列女执事医疗中心急诊科，随机选取了76名真实患者病例。测试在三个关键时间节点展开：

第一阶段是急诊分诊阶段，也就是患者刚被推进急诊室的那一刻。此时医生只能看到最基本的电子病历数据——生命体征、人口统计信息，以及护士写的几句主诉。

第二阶段是急诊医生首次接诊阶段。

第三阶段是收治入院或转入ICU阶段。

研究采用了严格的”零预处理”标准——AI模型接收到的电子病历，与人类医生看到的完全一致，都是急诊室里最原始、最混乱、充满缺失项的真实临床数据。

两名评审医生进行了盲评。他们不知道哪个诊断来自AI、哪个来自人类医生。结果令人震惊：一位评审医生在83.6%的情况下选择”分不清”，只有15.2%猜对了来源；另一位更夸张，94.4%选择”分不清”，仅有3.1%猜对。

核心数据对比

初始分诊阶段（信息最少的关键时刻）

据《科学》期刊论文数据，AI（OpenAI o1）的准确率为67%，而两位人类内科主治医生分别是55%和50%。AI领先人类医生12到17个百分点。

入院完善检查后

AI准确率提升至81%至82%，人类医生则提升至70%至79%。虽然这一差距在统计学上不再显著，但AI依然保持领先。

治疗方案制定（最令人震惊的数据）

在另一项测试中，AI与46名医生共同审阅5个复杂临床案例，任务包括设计抗生素使用方案、规划临终关怀流程等长期管理计划。

结果是AI方案得分高达89%，而使用传统搜索引擎等资源辅助的人类医生，得分中位数仅为34%。

差距超过两倍，用”断崖式领先”来形容毫不为过。

研究团队记录了一个典型案例，展示了AI在鉴别诊断方面的惊人能力。

一名患者因肺部血栓症状恶化就诊，人类医生最初判断是抗凝药物治疗失败，准备增加药量。但AI在阅读病史后，注意到患者同时患有红斑狼疮——这是一种自身免疫性疾病，可能引发肺部炎症。基于这一病史关联，AI推断患者可能是自身免疫性肺炎而非单纯的抗凝失败。

后续检查证实了AI的判断完全正确。

研究合著者、哈佛医学院博士生肖恩·巴克利（Thomas Buckley）解释了这个案例的意义：”在信息压缩的急诊场景中，人类医生容易陷入认知偏差或过度保守的陷阱。AI像一个永不疲倦的编译器，能进行高频的医学文献模式匹配。”

阿琼·曼赖在发布会上明确表示：”我不认为我们的发现意味着AI将取代医生，尽管一些销售AI医疗产品的公司可能会这么说。我认为这确实意味着我们正在见证一场深刻的技术变革，它将重塑医学。我们需要现在就评估这项技术，严肃地进行前瞻性临床试验。”

贝斯以色列女执事医疗中心AI项目负责人亚当·罗德曼（Adam Rodman）预测，未来十年将形成”医生、患者与人工智能系统”三方协作的照护模式。

他说：”你可以想象，如果一个系统能被动地运行在电子健康记录上，在诊断错误发生之前就识别出诊断错误和遗漏的诊断机会，这将大大改善医疗质量。”

这对普通人意味着什么

急诊室等待时间可能缩短

对于咱们老百姓来说，这项研究最直接的意义是：以后去急诊，可能不用排那么久的队了。

现在的急诊室普遍面临”过度拥挤”问题。据国家卫健委数据显示，国内三甲医院日均急诊量动辄三四百人次，值班医生人均接诊时间不足8分钟。分诊不准不仅耽误时间，还可能导致真正危急的患者被淹没在人群中。

AI分诊系统可以在患者挂号后几秒钟内完成初步评估，快速识别高风险患者，让真正需要紧急救治的人第一时间得到处理。

误诊漏诊风险降低

研究数据显示，在初始分诊阶段，AI的67%准确率大幅领先人类医生的50%至55%。对于病情复杂、症状不典型的老年患者来说，这意味着被误诊或漏诊的风险可能降低。

特别是在鉴别诊断方面，AI能发现人类医生因经验偏差而忽略的关联。比如前面提到的狼疮病例，如果单靠人类医生的经验判断，很可能按照”抗凝失败”的方向一路走下去。

老年人和慢病患者是最大受益群体

很多老年患者同时患有多种慢性疾病，症状表现往往不典型。一位78岁的老人说”胸口有点闷”，可能是心脏问题，也可能是肺部感染、贫血甚至焦虑情绪。

传统分诊靠护士经验加上患者自述，表述模糊就容易分错科室。据国内数据显示，三甲医院人工分诊准确率仅为70%至80%，基层医院更低。

AI分诊系统可以结合患者年龄、病史、过敏史、家族史等多维度信息综合判断，比任何一位分诊护士掌握的信息都更全面。

其实在国内，AI医疗已经不是”未来”的概念了。

2025年7月，国家卫健委在《关于加快推动AI技术在医疗领域院前和急诊分诊落地应用的提案答复》中明确表示，正在研究制定医疗机构人工智能应用管理规范，加快出台关于促进和规范”人工智能+医疗卫生”应用发展的政策文件。

国家卫健委在《关于政协第十四届全国委员会第三次会议提案答复的函》中提到，已在9个省份27个县（市、区）开展医学人工智能辅助诊疗系统试点。截至2024年，项目实施地区的基层机构通过辅助诊疗系统提供诊断建议近4万人次。

三甲医院落地案例

广州：AI分诊准确率达95%

广州市第一人民医院临床AI医生已于2026年正式试运行，智能分诊准确率高达95%，远超三甲医院人工分诊70%至80%的平均水平。

该系统搭载医疗专用多模态大模型和权威医学知识图谱，学习了上千万份三甲真实病例和专业诊疗指南。

武汉：急诊专用AI终端2分钟完成分诊

华工科技联合同济医院光谷院区研发的”灵智·医疗智能体”已在5家大型三甲医院完成超2万例问诊。

同济医院光谷院区急诊科主任介绍，2026年1月6日单日急诊量突破360人，仅两名医生值守。引入AI系统后，可在2分钟内完成分诊、导诊及结构化病历初稿生成，诊断正确率稳定在90%以上。

湖北：临床验证超93%准确率

湖北省中西医结合医院急诊科护士长反馈，AI系统”提升了分诊准确度，整合了分散的数据资源”，让护理工作从重复劳动中解放。

随机抽取1644份脱敏病历比对显示，预问诊准确率达93%以上，显著高于行业85%的平均水平。

四大局限：AI不是万能的

尽管数据亮眼，我们也要清醒认识到AI分诊的局限性。

局限一：看不到患者的”表情”

研究团队明确指出，这项比较仅限于可被文本化的病历数据层面。AI模型无法获取真实临床中至关重要的非文本信号：患者的痛苦表情、情绪状态、肢体语言，与家属的互动信息，甚至伤口气味等感官线索。

亚当·罗德曼形容得更直白：”AI在此次研究中更像一个辅助性的’第二意见’生成器，而非全能诊断者。”

局限二：弱势群体安全性尚未充分评估

研究论文没有说明AI在哪些类型患者中表现更差。老年患者、非英语母语患者、文化背景特殊的患者群体——这些弱势群体的安全性尚未得到充分评估。

波士顿医院的数据能代表全国急诊的人口结构吗？能代表基层医院和农村地区吗？这个问题没有答案。

局限三：责任归属问题悬而未决

一旦AI给出错误诊断，责任由谁承担？目前不存在正式的问责框架。

如果医生采纳了AI建议而结果出错，责任如何划分？或者更微妙的情况——医生本有正确判断，但被AI带偏了？

这种”责任真空”需要在AI医疗大规模推广前得到解决。

局限四：医生过度依赖的风险

谢菲尔德大学助理教授邢炜提出了一个值得警惕的问题：医生可能对AI产生依赖，弱化独立思考能力。

这并非杞人忧天。自动驾驶领域早有教训：人类监督员对系统过度信任，反应速度反而比纯人工操作更慢。急诊场景下，医生的决策窗口以分钟计，没有慢慢核实AI推理过程的奢侈。

目前AI分诊的正确姿态是”AI初筛+医生把关”。系统负责快速识别高风险患者、提示可能的诊断方向，最终决策权仍在医生手中。

哈佛这项研究最大的意义，不是证明”AI赢了医生”，而是揭示了一个深刻的变化：

医疗决策正在从单一依赖人类经验，向医生、患者与AI系统三方协同的新模式转型。

阿琼·曼赖说：”最终，我认为人类希望由人类来引导他们度过生死抉择，陪伴他们度过充满挑战的治疗，讨论那些影响他们生活质量和能否继续工作的决定。”

AI可以更准、更快地”看到”疾病，但治愈需要的，永远不只是诊断。

医患之间的人文关怀、信任与陪伴，这些是技术永远无法替代的。

但我们也要看到趋势：据美国医学会2026年调查，超过80%的美国医生已在职业中使用AI，是2023年的两倍；约20%的临床医生已经在向大语言模型寻求”第二意见”。

不久的将来，你去急诊，很可能先经过AI初筛——更快、更准、更安全。

技术的温度，终究是服务于人。让我们以开放的心态拥抱变化，同时保持理性的判断。

参考来源：

哈佛医学院研究论文，发表于《科学》期刊，2026年4月30日
Harvard Magazine，2026年4月30日
The Guardian，2026年4月30日
TechCrunch，2026年5月3日
国家卫健委《关于加快推动AI技术在医疗领域院前和急诊分诊落地应用的提案答复》，2025年7月
广州市第一人民医院AI医生试点公开报道，2026年4月
华工科技”灵智·医疗智能体”发布信息，2026年1月