AI诊断“准确率超医生”10%以上?急诊室将被颠覆,「药械企业」的“辅助驾驶”时代来了


大语言模型o1:急诊初诊准确率67%,人类医生只有50%-55%。
模拟真实急诊环境、信息残缺、节奏紧张——AI照样赢。
《科学》期刊最新研究:模型在98%的病例中拿到推理满分,主治医生仅35%。
这不是“替代医生”,这是给每个急诊室配一个永不疲倦的“第二诊疗大脑”。
药械企业听好了:AI辅助诊断的落地,不是技术问题,是场景、数据、合规和商业模式的竞赛。你现在入场,还来得及做规则的制定者。
一、硬核数据:《科学》杂志实锤,AI在急诊初诊阶段胜出
2025年(研究发表于近期),贝斯以色列女执事医疗中心联合哈佛大学计算机科学家,在《科学》期刊上发表了一项里程碑研究。
核心发现:
OpenAI的o1大语言模型(2024年末发布),在模拟真实急诊室诊疗流程中,精准或高度近似诊断准确率约为67%,而同期参与测试的执业医生准确率仅为50%-55%。
研究团队甚至一度担心结果太“碾压”,业界不愿意信。
测试设计极其刁钻:
不是给模型一份干净整洁的病历,而是模拟真实急诊的三个关键节点——患者向分诊护士描述症状、医生面诊评估、最终确定诊疗方案。
信息残缺、时间紧迫、患者表述混乱……所有现实中导致误诊的因素,模型都经历了。
结果:
– 在仅能获得有限病情信息的急诊初诊阶段,o1准确率比医生高出10个百分点以上。
– 后续补充更多信息后,模型仍全程领先2%-10%。
更夸张的是临床推理能力:
依据诊疗思路阐释和后续方案规划两项标准,o1在98%的测试病例中拿到满分;在职主治医生的满分率只有35%。

二、专家怎么看:真实场景测试“令人振奋”,但局限也很明显
未参与研究的达纳-法伯癌症研究所计算机科学家什蕾娅・乔里评价:
> “医学AI评估需要兼顾深度和广度,这项研究做到了。但下一步必须明确模型的高可靠适用场景。”
谷歌计算机科学家丹尼尔・麦克达夫:
> “能看到模型在真实医疗场景中接受测试,非常令人振奋。”
研究团队自己承认的局限:
1. 未测试长病程(数小时以上)或需参考长期病史的病例。急诊留观周期短,不等于住院、慢病场景。论文合著者罗德曼提醒:“模型不适用于住院多天、病历信息繁杂的患者。”
2. 仅输入文字病历,未纳入影像检查(CT、MRI、超声等)。而血栓、癌症的确诊高度依赖影像。
3. 尚未验证AI系统脱离实验室后,能否真正改善临床实际诊疗效果。
好消息是:罗德曼团队已启动新一轮实验,训练模型依托更长周期、更全面的真实医疗数据。
三、产业机会:AI辅助诊断的“辅助驾驶”模式,药企能做什么?
这项研究释放了一个强烈信号:在信息碎片化、时间高压的急诊场景,AI已经可以成为医生的可靠“副驾驶”。但对药械企业来说,机会不在“替代医生”,而在以下几个具体赛道:
赛道一:急诊临床决策支持系统(CDSS)的智能化升级
传统CDSS基于规则引擎(如UpToDate、BMJ Best Practice),响应慢、覆盖窄。
大语言模型能实时倾听医患对话、自动检索指南、提醒诊疗疏漏。
谁先开发出嵌入电子病历(EMR)的AI副驾驶模块,谁就能拿下急诊科的信息化采购预算。
赛道二:辅助诊断软件的NMPA/FDA注册与合规服务
AI诊断准确率达到67%,远超医生基线,意味着三类医疗器械注册证成为可能。
但监管路径还不成熟:算法更新频率、黑箱可解释性、持续学习后的重新验证……这些合规问题正是药械企业入局的壁垒,也是服务商的蓝海。
赛道三:非文本数据(影像、波形)与LLM的融合
研究中o1只用了文字。真实临床中,心电图、血压波形、超声影像才是决策核心。
谁能把多模态大模型(文本+影像+时序信号)做成产品,谁就能建立技术代差。
赛道四:真实世界验证与医院试点
实验室再好的模型,进医院后可能“水土不服”。
药械企业需要与顶级医疗中心合作,开展前瞻性随机对照试验,证明AI辅助诊断能减少误诊、降低医疗纠纷、缩短急诊滞留时间。
这正是真实世界研究(RWS)的需求爆发点。
四、杏林苑能帮你做什么:调研 + 真实世界研究 + 企业合规
《科学》这篇论文,给你的不是焦虑,是路线图。
但每个药械企业的情况不同,你需要回答:
– 我们现有产品(设备、软件、耗材)如何与AI诊断系统整合?
– 国内三甲医院急诊科对AI辅助诊断的采购意愿、预算、决策链是什么?
– 如果我们要开发或引进这类技术,合规差距有多大?NMPA目前有无同类产品获批?
本文事实依据:《科学》期刊最新研究、OpenAI o1技术报告、专家公开评论。
~杏林苑医创观察——10万药械企业决策者的产业雷达。~

— The end —
编辑:何笑笑
作者:廖联明 福建医科大学附属协和医院中心实验室副研究员
药理学博士,现任福建医科大学附属协和医院中心实验室副研究员、硕士研究生导师。他主要从事干细胞基础与临床应用研究、转化医学研究以及临床科研设计教学工作
廖博士在干细胞生物学领域具有深厚的学术积累,首次报道了骨髓来源的Flk1+CD34-细胞具有血液血管干细胞特性,并在间充质干细胞治疗肝硬化、糖尿病、急性呼吸窘迫综合征等疾病的研究中取得了多项成果。他主持或参与了多项国家级及省部级课题研究,发表SCI收录论文180余篇。在援疆工作中,他积极投身智力援疆,通过远程指导、开设“科研门诊”等方式,助力昌吉回族自治州人民医院提升科研能力和临床研究水平
小编:重生
免责声明:本文原创,仅供同行交流学习,不构成商业目的,不构成诊疗建议,如有侵权请联系删除(小编微信xly-0007);平台法律顾问:彭继友律师 王佳莉律师


👇
学协会、刊物、出版社、科普报社广告征集
点击下方“阅读原文”提交调研(访谈/真实世界研究)需求
夜雨聆风