用AI拍照估算碳水,给糖尿病人用: 这个想法有多危险吃饭前拍一张照片,AI告诉你这顿饭有多少碳水,糖尿病人据此决定打多少胰岛素,或者吃多少。
▌实验是怎么做的
他把13张食物照片——奶酪三明治、西班牙海鲜饭、焦糖布丁等——分别提交给四个主流大模型:GPT-5.4、Claude Sonnet 4.6、Gemini 2.5 Pro、Gemini 3.1 Pro。第二,更严重的是——同一个模型,同一张照片,每次给出的答案也不一样。
▌具体差距有多大
Gemini 2.5 Pro的估算值,在同一张照片上的波动范围是55克到484克。对一个需要根据碳水含量打胰岛素的糖尿病人来说,这不是误差,这是灾难。估算值相对集中的是Claude Sonnet 4.6,但波动范围同样不小。GPT-5.4的平均估算值是74克,其他三个模型平均是28克。模型甚至有时认不出食物本身——把三明治里的奶酪识别成了一块熟肉。
▌为什么AI做不到这件事
不是这几个模型不够好,是这件事的本质决定了AI很难做到。同一张照片里,食物的分量、密度、烹饪方式,从二维图像里无法精确推断。西班牙海鲜饭是浅盘还是深盘,米饭是煮透了还是半生,这些细节决定了碳水含量,但照片里看不清楚。大模型生成文字的方式,是基于训练数据的概率分布,不是在执行精确计算。同样的输入,每次输出都有随机性,这在写文章时是优点,在医疗估算时是致命缺陷。不同的拍摄角度、光线、盘子大小,都会影响模型的判断,而这些变量在真实使用中无法控制。
▌这件事的边界在哪里
它可以做的:帮你大致判断这顿饭的食物类型,给出一个粗略的量级参考(比如"这是高碳水餐食")。糖尿病人的胰岛素剂量算错了,后果可能是低血糖昏迷,或者血糖急剧飙升。这不是AI不够努力,是它当前的工作方式,天然不适合这类任务。