OpenAI AI模型在急诊诊断中表现优于人类医生-夜雨聆风

OpenAI AI模型在急诊诊断中表现优于人类医生

OpenAI 的 o1-preview 推理模型在真实急诊诊断中，准确率显著优于人类医生，这是 2026 年 4 月 30 日发表在《Science》上、由哈佛医学院主导的重磅研究结论。

一、研究概况（权威、最新）

发表：Science（2026-04-30）

团队：哈佛医学院、贝斯以色列女执事医学中心、斯坦福大学

模型：OpenAI o1-preview（2024 年底发布，强推理 LLM）

对比对象：2 名资深急诊主治医生（专家级）

病例：76 例波士顿医院真实急诊病历（纯文本：主诉、生命体征、护士记录）

场景：急诊早期分诊（信息最少、最关键）

二、核心数据：AI vs 人类医生

早期分诊（信息最少阶段）

AI（o1-preview）：67.1% 准确诊断率

人类医生 A：55.3%

人类医生 B：50.0%

→ AI 领先 12–17 个百分点，差异统计学显著

信息增加后（随访阶段）

AI：82%

医生：70–79%

→ 仍领先，但差距缩小、无统计显著性

经典难题库（NEJM 143 例）

AI：78.3% 正确率

→ 远超传统临床决策软件与一般医师水平

三、AI 为什么在急诊更准？（关键优势）

信息碎片整合力极强

急诊病历混乱、主诉模糊、数据不全。AI 擅长把非结构化文本快速关联、概率加权。

无疲劳、无偏见、无情绪

不受夜班、压力、经验盲区、认知偏差影响。

知识覆盖无限

瞬间检索海量指南、罕见病、合并症，人类医生记忆有限。

“不确定环境” 更稳

信息越少、越混乱，AI 相对优势越明显 ——正是急诊痛点。

四、典型案例（AI 救场）

患者：肺栓塞治疗后反复恶化

医生：怀疑药物失效

AI 从病历中捕捉到隐匿狼疮病史 → 诊断为狼疮引发的心肌炎

结果：纠正误诊、救命

五、研究明确结论（不是 “取代医生”）

✅ AI ≠ 替代医生，而是高级临床决策支持工具

✅ 最适合：早期分诊、鉴别诊断、第二意见、防漏诊误诊

✅ 医生仍不可替代：面诊、查体、沟通、伦理、最终决策、操作

✅ 方向：人机协作 → 医生更准、更快、更安全

六、意义与影响

全球首次：在真实急诊、纯文本、盲测、顶级专家对照下证明 LLM 诊断优势

每年美国急诊约 740 万例误诊，AI 可大幅减少

推动全球医院急诊 AI 分诊加速落地

中国也在布局：阿里达摩院 iAorta 等在急诊影像诊断已达国际领先水平

总结：

AI 不是来抢医生饭碗，而是让好医生变得更强、让急诊更安全。