
论文来源:
Isobe T, Zhang LW, Murakami H, et al. Accuracy of AI-Based Nutrient Estimation from Standardized Hospital Meal Images: A Comparison with Registered Dietitians. Nutrients. 2026;18(6):966. DOI: 10.3390/nu18060966.
“AI 已经可以比较准确地看见餐盘中的“体积”,但仍然很难看见食物中的“密度”。换句话说:AI 可以大致判断你吃了多少米饭,却未必知道这一盘菜到底放了多少油。” |
15 份标准化医院餐 | 10 + 10注册营养师与 AI 模型 | +52.3%ChatGPT-4o 脂肪平均高估 |
一张餐盘照片,AI 能不能自动识别食物,并估算出热量、蛋白质、脂肪和碳水化合物?
这可能是很多营养师最近非常关心的问题。过去,营养调查常常需要依靠膳食回顾、饮食记录、食物称重或者食物频率问卷。营养师不仅要花费大量时间追问细节,还要面对一个现实问题:很多人根本记不清楚自己吃了多少。
如果拍一张照片,AI 就能快速完成初步分析,营养师的工作效率显然会大幅提升。
但问题也随之而来:AI 真的能够看懂一顿饭吗?它能够识别米饭、牛奶和水果,也能够识别油、酱汁和烹饪过程中吸收的脂肪吗?

2026 年 3 月,发表于营养学期刊《Nutrients》的一篇研究,给出了一个非常值得营养师认真思考的答案。
01 这项研究究竟做了什么?
在接近理想的拍摄条件下,测试 AI 对标准化医院餐的营养估算能力。
论文题目为《基于标准化医院餐食图片的 AI 营养素估算准确性:与注册营养师的比较》。研究团队选择了 15 份标准化医院餐,覆盖早餐、午餐和晚餐。这些餐食来自一套常见的医院膳食方案,按照每日约 1800 千卡设计,平均每餐约 600 千卡。
研究对象15 份标准化医院餐,覆盖早餐、午餐和晚餐 | 真实值食物烹饪后直接称重,结合日本食物成分表计算 |
拍摄条件手机垂直俯拍,距离固定 50 cm,光照稳定 | 对比对象10 名注册营养师;10 种 AI 模型或营养评估应用 |

图 1|论文第 4 页展示的标准化医院餐样例:早餐、午餐和晚餐。图片来源:Isobe et al., Nutrients, 2026。
从图片可以看出,这些餐食并不是只有一个菜的简单餐盘,而是包括米饭、鱼肉、鸡肉、豆制品、蔬菜、汤、牛奶、水果和调味配菜等多个组成部分。这已经比“识别一根香蕉”或者“识别一碗白米饭”复杂得多。
读论文时不要忽略这一点需要注意:这是一种接近“理想实验室环境”的测试。真实生活中的光线、拍摄角度、外卖酱汁、家庭炒菜和混合菜肴往往更加复杂。 |
02 AI 与谁进行比赛?
研究团队邀请了 10 名具有 5 年以上医院营养管理经验的注册营养师,让他们仅根据餐盘照片,估算每顿饭的热量和三大产能营养素。与此同时,研究者也测试了 10 种 AI 模型或营养评估应用。
● 通用型多模态模型:ChatGPT-4o、Gemini 1.5 Pro、Claude 3.5 Sonnet、Gemini 1.5 Flash;
● 营养评估应用:Foodita、Calomil、Asken、FiNC、OWN、CALO mama Plus;
● 统一要求:根据图片估算能量、蛋白质、脂肪和碳水化合物,并输出具体数值。
“研究者没有告诉 AI 菜名,也没有补充食材、克数、烹饪方式和调味信息。AI 只能“看图猜答案”。” |
经过初步筛选,热量估算表现较好的三个模型进入后续重点分析:ChatGPT-4o、Gemini 1.5 Pro 和 Foodita。
03 先看懂四个指标,才不会被“高相关性”误导
阅读这篇论文,需要区分四种不同含义: ✓ 相关系数 r:判断 AI 能否识别不同餐盘之间的高低变化。相关性高,不代表每一顿饭都算得准。 ✓ 平均绝对误差 MAE:反映每次估算平均差多少。 ✓ 平均偏差:判断 AI 更倾向于高估还是低估。 ✓ 误差在±10% 以内的命中率:最直观地反映结果是否具有实际使用价值。 |
举例来说,一个 AI 即使每次都高估 100 千卡,也可能拥有不错的相关性。因此,营养师不能只看一个 r 值,就直接得出“AI 已经算准了”的结论。
营养指标 | 注册营养师 | ChatGPT-4o | Gemini 1.5 Pro | Foodita |
热量:±10%命中率 | 86.7% | 73.3% | 60.0% | 46.7% |
蛋白质:平均偏差 | -3.5% | +10.6% | +17.7% | +20.8% |
脂肪:平均偏差 | +13.1% | +52.3% | +33.8% | +36.9% |
碳水:平均偏差 | -7.2% | -12.8% | -13.9% | -11.2% |
注:数据整理自论文第 6 页 Table 2。正值表示高估,负值表示低估。
04 热量估算:AI 已经进入“可辅助使用”阶段
15 份医院餐的真实平均热量为 605.2 千卡。注册营养师的平均估算值为 589.8 千卡;ChatGPT-4o 为 593.0 千卡;Gemini 1.5 Pro 为 587.6 千卡;Foodita 为 599.2 千卡。

图 2|热量估算误差在 ±10% 以内的餐次占比。数据整理自论文第 6 页 Table 2。
从平均值看,三个表现较好的 AI 模型都比较接近真实结果。注册营养师仍然更加稳定,但 ChatGPT-4o 已经显示出一定实用价值:15 份餐食中,有 73.3%的热量估算误差控制在±10% 以内。
对于标准化餐食的初步筛查、日常记录和趋势监测,AI 的热量估算已经不是“玩具级”能力,而是逐渐进入可以辅助工作的阶段。 |
05 碳水化合物:趋势判断不错,但不能过度乐观
为什么 AI 对热量和碳水化合物的估算相对更好?一个重要原因是:主食通常具有比较明显的体积。一碗米饭、一片面包、一份面条,视觉上相对容易识别。
在这项研究中,很多餐食都包含 200 克米饭。对于 AI 而言,这种标准化摆盘能够提供相对稳定的视觉线索。
但需要看到另一面:ChatGPT-4o 的碳水化合物平均偏差仍为 -12.8%。这说明它可以大致识别餐盘之间的高低变化,却仍可能系统性低估。
临床提示在糖尿病患者碳水化合物计数、胰岛素剂量匹配或特殊疾病饮食管理中,单纯依靠图片识别仍然不够稳妥。 |
06 蛋白质:临床场景要警惕持续高估
与米饭相比,蛋白质的判断困难得多。因为蛋白质并不是一种可以直接“看见”的物质。
同样是一块肉,它可能是鸡胸肉,也可能是鸡腿肉;可能是瘦牛肉,也可能夹杂脂肪;可能是鱼肉,也可能是裹粉油炸之后的鱼排。豆腐、鸡蛋、鱼肉、肉末和混合菜肴,也会进一步增加识别难度。
研究结果显示,AI 对蛋白质存在不同程度的高估:ChatGPT-4o 平均高估 10.6%,Gemini 1.5 Pro 平均高估 17.7%,Foodita 平均高估 20.8%。
对于普通人来说,一顿饭多估几克蛋白质,未必立刻造成严重影响。但在老年人肌少症管理、肿瘤营养、术后康复、肾脏疾病、重症营养和儿童生长发育评估中,持续高估可能让营养师误以为患者“吃得还可以”,从而忽略真正存在的摄入不足。
07 最大的问题:AI 很难看见“油”
这篇论文最值得关注的发现,是脂肪估算。15 份餐食的真实平均脂肪含量为 13.0 克。注册营养师估算为 14.7 克,ChatGPT-4o 估算为 19.8 克,Gemini 1.5 Pro 为 17.4 克,Foodita 为 17.8 克。

图 3|脂肪估算的平均偏差。ChatGPT-4o 平均高估 52.3%。数据整理自论文第 6 页 Table 2。
“真实脂肪如果是 13 克,ChatGPT-4o 平均会估算到接近 20 克:脂肪平均高估 +52.3%。” |
为什么会出现这么明显的误差?因为油脂经常是餐盘中的“隐形营养素”。我们可以看到一块鱼,却很难仅凭照片判断它用了多少油;可以看到一盘蔬菜,却不知道它是清炒、焯拌,还是加入了芝麻酱和蛋黄酱;可以看到酱汁,却很难判断里面究竟包含多少糖、油和淀粉。
论文作者将这种问题概括为“invisible nutrient bias”,也就是“不可见营养素偏差”。这是一个非常值得营养师记住的概念。
“AI 的视觉识别能力再强,也不代表它能够看见图片中没有呈现的信息。AI 不是不会计算,而是缺少关键输入。” |
08 这篇论文不是在证明“AI 可以替代营养师”
看到这里,有人可能会问:既然 AI 估算热量已经比较接近注册营养师,是不是以后营养师就不需要做膳食评估了?答案显然不是。
● AI 表现较好的场景,是摆盘规整、光线稳定、主食分量相对固定的标准化医院餐。
● 真实世界中的家庭饮食、外卖、聚餐、火锅、盖浇饭、麻辣烫、浓稠酱汁和混合菜肴会进一步增加估算难度。
● 研究评估的是完整餐盘,而临床真正关心的是患者吃下去多少、剩下多少、连续几天有没有下降,以及是否需要进一步干预。
更重要的是,注册营养师并不是一台“更慢的营养计算器”。营养师真正重要的价值,是根据患者疾病状态、饮食习惯、治疗方案、营养风险和执行能力,判断什么信息重要,什么结果需要复核,以及下一步应该采取什么行动。
09 更合理的工作方式:营养师带着 AI 工作
这篇论文真正有价值的地方,不是宣布 AI 战胜了营养师,而是清楚地告诉我们:AI 最适合处理标准化、重复性强、可以被结构化的工作。
AI 可以帮助营养师完成这些工作: ✓ 根据餐盘照片进行初步识别,快速估算热量和主要营养素; ✓ 生成饮食记录初稿,对比连续多天的摄入变化; ✓ 标记可能存在摄入不足的餐次; ✓ 提醒营养师重点复核脂肪、蛋白质和混合菜肴; ✓ 根据预设规则生成复诊前的追踪清单。 |
但在真正用于临床或健康管理之前,还需要加入菜名、食材构成、大致重量、烹饪方式、是否使用油或酱汁、是否吃完、剩余比例、患者疾病情况和营养目标。
“AI 负责快速整理、初步估算和发现线索;营养师负责设定目标、补充信息、识别风险、解释结果和做出判断。” |
这就是更加合理的 Human-in-the-loop 模式:人类始终参与其中。
10 阅读论文时,还需要保持一点专业谨慎
● 研究仅测试了 15 份标准化医院餐,样本量仍然较小。
● 拍摄条件接近理想环境,真实家庭场景可能更加复杂。
● 研究主要评估热量和三大产能营养素,没有覆盖膳食纤维、钠、钾、钙、铁和维生素等指标。
● AI 模型版本更新速度很快,这篇论文反映的是特定时间点的能力快照。
“不要只看摘要中的一句“AI 表现接近营养师”,更要看它在哪些指标上接近,又在哪些指标上仍然存在明显短板。” |
11 对营养师来说,真正值得思考的是什么?
AI 营养评估正在快速发展。但营养师没有必要把问题简化成:“AI 会不会取代我?”
更值得思考的问题是:“我能不能把 AI 放到正确的位置上?”
AI 可以帮助营养师减少大量重复劳动:整理客户资料、生成初步评估框架、协助文献检索、提取论文重点、制作科普内容、生成课件初稿、整理复诊数据,以及建立标准化服务流程。
“AI 看得见米饭的体积,却未必看得见锅里的油。营养师真正不可替代的价值,是知道什么时候可以相信 AI,什么时候必须再追问一句:“这道菜到底是怎么做的?”” |
12 我为什么越来越重视营养师的 AI 实战能力?
这也是我持续打磨“飞哥营养师 AI 实战训练营”的原因。飞哥营养师AI实战营2.0来了:专为0基础营养师设计,不讲玄学,只讲落地!
我希望带大家学习的,不只是几个好玩的工具,也不是背诵几条固定提示词。真正重要的是,把 AI 放进营养师每天真实发生的工作场景中。
飞哥营养师 AI 实战训练营,重点关注这些真实场景: ✓ 文献检索、论文解读与专业内容提炼; ✓ 公众号科普、小红书笔记与专业 IP 内容创作; ✓ PPT、信息图与营养师视觉表达; ✓ 客户资料预审、首诊提纲与复诊追踪清单; ✓ 临床营养工作提效、专病营养服务与团队 SOP; ✓ 营养师专属 Skills、轻量 Coding 与 AI Agent 工作流。 |
“少一点混乱,多一点结构;少一点临时发挥,多一点专业沉淀;少一点机械劳动,多一点真正有价值的服务。” |
未来更有竞争力的营养师,未必是最早追逐每一个新工具的人。但一定是能够把专业知识、服务经验和 AI 工作流真正结合起来的人。
AI 可以帮助我们走得更快。营养师的专业判断,决定了我们最终走向哪里。
参考论文信息与声明
飞哥推荐营养师AI时代必读文章:
飞哥营养师AI实战营2.0来了:专为0基础营养师设计,不讲玄学,只讲落地!
六一特别策划|儿童营养门诊AI智能助手正式开售:把 AI 变成儿童营养师的门诊搭档!
135491 顿饭训练出的 AI,发现了一个更容易坚持的健康饮食方法
专为体重管理营养师制作的skill——减脂平台期分析助手上线啦!
营养师专用 AI Skill 来了:第一个肠道微生态营养咨询助手上线!
专为体重管理营养师制作的skill——减脂平台期分析助手上线啦!
专为营养师打造的小红书内容引擎skill上线了!让营养师更快追热点、做内容!
飞哥营养师 Skills 开卖了:三日饮食记录分析 Skill 正式上线!
营养师必看!AI从真实世界用药帖里,挖出了 GLP-1 最容易被忽视的身体信号
1万名注册营养师 × AI Agent,撑起17亿融资:营养师的下一个分水岭来了!
京东618把 AI 营养师放进服务闭环:营养师的分水岭,真的来了!
AI时代,营养师必须补上的一课|2026美国营养师协会&美国营养学会《注册营养师AI与机器学习指南》全文首发全译


夜雨聆风