乐于分享
好东西不私藏

OpenAI AI模型在急诊诊断中表现优于人类医生

OpenAI AI模型在急诊诊断中表现优于人类医生

OpenAI 的 o1-preview 推理模型在真实急诊诊断中,准确率显著优于人类医生,这是 2026 年 4 月 30 日发表在《Science》上、由哈佛医学院主导的重磅研究结论。

一、研究概况(权威、最新)

发表:Science(2026-04-30)

团队:哈佛医学院、贝斯以色列女执事医学中心、斯坦福大学

模型:OpenAI o1-preview(2024 年底发布,强推理 LLM)

对比对象:2 名资深急诊主治医生(专家级)

病例:76 例波士顿医院真实急诊病历(纯文本:主诉、生命体征、护士记录)

场景:急诊早期分诊(信息最少、最关键)

二、核心数据:AI vs 人类医生

早期分诊(信息最少阶段)

AI(o1-preview):67.1% 准确诊断率

人类医生 A:55.3%

人类医生 B:50.0%

→ AI 领先 12–17 个百分点,差异统计学显著

信息增加后(随访阶段)

AI:82%

医生:70–79%

→ 仍领先,但差距缩小、无统计显著性

经典难题库(NEJM 143 例)

AI:78.3% 正确率

→ 远超传统临床决策软件与一般医师水平

三、AI 为什么在急诊更准?(关键优势)

信息碎片整合力极强

急诊病历混乱、主诉模糊、数据不全。AI 擅长把非结构化文本快速关联、概率加权。

无疲劳、无偏见、无情绪

不受夜班、压力、经验盲区、认知偏差影响。

知识覆盖无限

瞬间检索海量指南、罕见病、合并症,人类医生记忆有限。

“不确定环境” 更稳

信息越少、越混乱,AI 相对优势越明显 ——正是急诊痛点。

四、典型案例(AI 救场)

患者:肺栓塞治疗后反复恶化

医生:怀疑药物失效

AI 从病历中捕捉到隐匿狼疮病史 → 诊断为狼疮引发的心肌炎

结果:纠正误诊、救命

五、研究明确结论(不是 “取代医生”)

✅ AI ≠ 替代医生,而是高级临床决策支持工具

✅ 最适合:早期分诊、鉴别诊断、第二意见、防漏诊误诊

✅ 医生仍不可替代:面诊、查体、沟通、伦理、最终决策、操作

✅ 方向:人机协作 → 医生更准、更快、更安全

六、意义与影响

全球首次:在真实急诊、纯文本、盲测、顶级专家对照下证明 LLM 诊断优势

每年美国急诊约 740 万例误诊,AI 可大幅减少

推动全球医院急诊 AI 分诊加速落地

中国也在布局:阿里达摩院 iAorta 等在急诊影像诊断已达国际领先水平

总结:

AI 不是来抢医生饭碗,而是让好医生变得更强、让急诊更安全。