OpenAI AI模型在急诊诊断中表现优于人类医生

OpenAI 的 o1-preview 推理模型在真实急诊诊断中,准确率显著优于人类医生,这是 2026 年 4 月 30 日发表在《Science》上、由哈佛医学院主导的重磅研究结论。
一、研究概况(权威、最新)
发表:Science(2026-04-30)
团队:哈佛医学院、贝斯以色列女执事医学中心、斯坦福大学
模型:OpenAI o1-preview(2024 年底发布,强推理 LLM)
对比对象:2 名资深急诊主治医生(专家级)
病例:76 例波士顿医院真实急诊病历(纯文本:主诉、生命体征、护士记录)
场景:急诊早期分诊(信息最少、最关键)
二、核心数据:AI vs 人类医生
早期分诊(信息最少阶段)
AI(o1-preview):67.1% 准确诊断率
人类医生 A:55.3%
人类医生 B:50.0%
→ AI 领先 12–17 个百分点,差异统计学显著
信息增加后(随访阶段)
AI:82%
医生:70–79%
→ 仍领先,但差距缩小、无统计显著性
经典难题库(NEJM 143 例)
AI:78.3% 正确率
→ 远超传统临床决策软件与一般医师水平
三、AI 为什么在急诊更准?(关键优势)
信息碎片整合力极强
急诊病历混乱、主诉模糊、数据不全。AI 擅长把非结构化文本快速关联、概率加权。
无疲劳、无偏见、无情绪
不受夜班、压力、经验盲区、认知偏差影响。
知识覆盖无限
瞬间检索海量指南、罕见病、合并症,人类医生记忆有限。
“不确定环境” 更稳
信息越少、越混乱,AI 相对优势越明显 ——正是急诊痛点。
四、典型案例(AI 救场)
患者:肺栓塞治疗后反复恶化
医生:怀疑药物失效
AI 从病历中捕捉到隐匿狼疮病史 → 诊断为狼疮引发的心肌炎
结果:纠正误诊、救命
五、研究明确结论(不是 “取代医生”)
✅ AI ≠ 替代医生,而是高级临床决策支持工具
✅ 最适合:早期分诊、鉴别诊断、第二意见、防漏诊误诊
✅ 医生仍不可替代:面诊、查体、沟通、伦理、最终决策、操作
✅ 方向:人机协作 → 医生更准、更快、更安全
六、意义与影响
全球首次:在真实急诊、纯文本、盲测、顶级专家对照下证明 LLM 诊断优势
每年美国急诊约 740 万例误诊,AI 可大幅减少
推动全球医院急诊 AI 分诊加速落地
中国也在布局:阿里达摩院 iAorta 等在急诊影像诊断已达国际领先水平
总结:
AI 不是来抢医生饭碗,而是让好医生变得更强、让急诊更安全。
夜雨聆风