据第一财经报道,美国哈佛医学院的一个研究团队评估了20几种最先进的AI大型语言模型的诊断能力,其中包括ChatGPT、DeepSeek、Gemini和Claude。结果显示,基于患者的初步症状和体征进行“鉴别诊断”的错误率高达80%。
哈佛医学院这研究有意思啊。说直白点,现在这些AI看病就跟赌徒押大小似的,患者给的信息越多,它蒙对的概率就越高。但你要真把命交给这玩意儿,我劝你先把遗嘱写明白。去年我一同学肾结石发作,疼得满地打滚。他倒好,先拍了张舌苔照让AI看。结果那破程序非说他是肝火旺盛,气得我直接把他拽进医院。后来CT一做,输尿管都堵成下水道了。猜猜怎么着?现在他见人就说AI看病还不如百度靠谱。数据不会骗人。80%的误诊率啥概念?相当于你找十个医生看病,八个都是庸医。更绝的是,就算你把验血单、X光片全塞给AI,它还有四成概率给你瞎指挥。这是看病?我看是开盲盒碰运气。要我说啊,AI这玩意儿就该当医疗界的“二锅头”——能助兴但不能当主食。比如让它帮着整理病历、分析影像,效率确实高。但真要让它给你下诊断?你先看看它代码里有没有写“误诊不负责”这行字。有人可能觉得,AI能24小时接诊多方便。可你想想,半夜三点肚子疼,你是愿意跟个冰冷的程序扯皮,还是想让急诊科大夫摸黑给你查体?记住了,AI是工具不是神医。下次身体不舒服,先摸摸自己的脉搏,再摸摸钱包。前者能救命,后者能让你找到真医生。