——一篇发表在《自然》杂志上的重磅研究,用500多个真实病例测试了一个名叫MIRA的AI医生,结果令人振奋。

一、这项研究要解决什么问题?
现在的人工智能(比如ChatGPT)已经能回答很多医学问题了。但回答问题和真正动手治病是两码事。
真正的医生需要:
问诊——听患者描述症状
开检查——抽血、拍片、做培养
解读结果——看懂化验单和影像
下诊断——判断得了什么病
给治疗——开药、安排手术、决定是否住院
整个过程都在医院的电子病历系统里完成。
目前的大语言模型大多只能“回答问题”,还不能“动手操作”。这篇研究就想测试:一个能自主操作的AI,能不能像真医生一样完整地看一个急诊病人?
二、MIRA是什么?
MIRA(全称:医学智能推理与行动代理)是一个专门为急诊科设计的AI医生系统。
它有这些“超能力”:
能聊天问诊:像医生一样和“虚拟病人”对话,询问症状和病史。
能开检查单:可以开验血、验尿、微生物培养、CT、X光等。
能看结果:自动解读化验单和影像报告。
能下诊断:综合所有信息,判断最可能的疾病。
能开药和安排手术:给出具体治疗方案。
能决定是否住院:判断患者是需要住院还是可以回家。
关键点:MIRA能真正“操作”电子病历系统,不只是动嘴皮子。
三、怎么测试MIRA?
研究人员用了MIMIC-IV数据库——这是一个包含约30万名美国真实患者病历的公开数据集。
他们从中筛选了574个急诊病例,涵盖8种常见/重要的疾病:
测试方式:
MIRA通过聊天向一个“虚拟患者”问诊,这个虚拟患者的回答完全基于真实病历。
MIRA可以随时开检查、看结果、做决策。
研究人员将MIRA的表现与两组真人医生对比:
组1:4位经验丰富的专科医生(7-11年经验)
组2:6位不同资历的医生(含住院医和专家),代表典型急诊科团队
四、主要结果:MIRA表现如何?
1. 诊断准确性 —— MIRA比医生更准
| 87.8% | ||
| 87.8% |
在胰腺炎诊断中,MIRA准确率达95.2%,而专科医生仅78.6%。
在阑尾炎中,MIRA准确率98.6%(148例只漏了2例)。
肺炎和尿路感染的诊断相对较低(约72-77%),医生也同样在这些病上表现不佳。
通俗说:在大多数疾病上,MIRA诊断比医生更准或一样准,没有明显落后。
2. 工作流程 —— MIRA像真医生一样思考
研究人员分析了MIRA的“决策轨迹”,发现它遵循和人类医生非常相似的流程:
问诊 → 体格检查 → 验血 → 影像检查 → 用药 → 手术安排 → 入院
每一步的决策也符合临床常规。比如,MIRA最常开的血液检查项目与真实病历高度吻合。
3. 手术决策 —— MIRA能正确安排手术
阑尾炎:MIRA为100%的患者正确安排了腹腔镜阑尾切除术。
胆囊炎:90.6%正确安排了胆囊切除术。
整体手术匹配率:MIRA 53.5% vs 专科医生38.3%,MIRA表现更好。
4. 用药安全 —— MIRA很安全
对MIRA开出的468张处方进行安全性检查:
| 0次 | |
| 0次 | |
| 0次 | |
| 0次 | |
| 0次 | |
| 99.8% |
通俗说:MIRA开药非常安全,极少犯错。
5. 入院决策 —— MIRA绝不漏掉需要住院的病人
测试了肺炎和肺栓塞两类患者:
需要住院的患者,MIRA 100%都正确收治了(没有遗漏任何一个危重病人)。
小问题是过于谨慎:偶尔会把不需要住院的患者也建议收治(宁可“错杀”也不放过)。这在临床上是更安全的错误方向。
6. 抗“忽悠”能力 —— MIRA不容易被带偏
研究人员故意“刁难”MIRA:
让虚拟患者说自己“坚信得了癌症”(实际不是)
让患者说“我觉得自己很健康”(实际有病)
改变患者性别
让患者只说外语
结果:MIRA的诊断准确率没有显著变化,说明它不容易被患者的主观想法带偏。
五、MIRA有什么局限性?
患者是虚拟的:真正的急诊患者说话可能更混乱、更情绪化,MIRA面对真人效果如何还不确定。
数据可能有“作弊”风险:MIRA的训练数据可能包含了MIMIC-IV数据库的内容,就像学生提前拿到了考题。研究人员认为这种可能性不大,但不能完全排除。
不能替代医生:研究者强调,MIRA的目标是辅助医生,而不是取代医生。理想场景是:
MIRA负责繁琐的文书工作、药物核对、检查组合建议
医生做最终决策和与患者面对面沟通
六、这项研究的意义是什么?
这是首个证明AI代理能在完整急诊流程中达到医生水平的研究。
它的突破不在于“AI会回答问题”,而在于:
AI能像医生一样,在电子病历系统里真正“动手”操作——从问诊到开检查到下诊断到开药到决定住院,一气呵成。
虽然离真正在医院里独立上岗还有距离,但这为未来AI医生助手走进现实迈出了关键一步。
七、一句话总结
MIRA证明,一个能自主操作电子病历系统的AI,在急诊诊断、用药安全、治疗决策等方面可以达到甚至超过人类医生的水平。未来,这样的AI助手可以帮医生处理大量繁琐工作,让医生有更多时间专注在患者身上

夜雨聆风