AI VS 注册营养师:同一份医院餐,谁算得更准?

论文来源：

Isobe T, Zhang LW, Murakami H, et al. Accuracy of AI-Based Nutrient Estimation from Standardized Hospital Meal Images: A Comparison with Registered Dietitians. Nutrients. 2026;18(6):966. DOI: 10.3390/nu18060966.

“AI 已经可以比较准确地看见餐盘中的“体积”，但仍然很难看见食物中的“密度”。换句话说：AI 可以大致判断你吃了多少米饭，却未必知道这一盘菜到底放了多少油。”

15 份标准化医院餐

10 + 10注册营养师与 AI 模型

+52.3%ChatGPT-4o 脂肪平均高估

一张餐盘照片，AI 能不能自动识别食物，并估算出热量、蛋白质、脂肪和碳水化合物？

这可能是很多营养师最近非常关心的问题。过去，营养调查常常需要依靠膳食回顾、饮食记录、食物称重或者食物频率问卷。营养师不仅要花费大量时间追问细节，还要面对一个现实问题：很多人根本记不清楚自己吃了多少。

如果拍一张照片，AI 就能快速完成初步分析，营养师的工作效率显然会大幅提升。

但问题也随之而来：AI 真的能够看懂一顿饭吗？它能够识别米饭、牛奶和水果，也能够识别油、酱汁和烹饪过程中吸收的脂肪吗？

2026 年 3 月，发表于营养学期刊《Nutrients》的一篇研究，给出了一个非常值得营养师认真思考的答案。

01 这项研究究竟做了什么？

在接近理想的拍摄条件下，测试 AI 对标准化医院餐的营养估算能力。

论文题目为《基于标准化医院餐食图片的 AI 营养素估算准确性：与注册营养师的比较》。研究团队选择了 15 份标准化医院餐，覆盖早餐、午餐和晚餐。这些餐食来自一套常见的医院膳食方案，按照每日约 1800 千卡设计，平均每餐约 600 千卡。

研究对象15 份标准化医院餐，覆盖早餐、午餐和晚餐	真实值食物烹饪后直接称重，结合日本食物成分表计算
拍摄条件手机垂直俯拍，距离固定 50 cm，光照稳定	对比对象10 名注册营养师；10 种 AI 模型或营养评估应用

图 1｜论文第 4 页展示的标准化医院餐样例：早餐、午餐和晚餐。图片来源：Isobe et al., Nutrients, 2026。

从图片可以看出，这些餐食并不是只有一个菜的简单餐盘，而是包括米饭、鱼肉、鸡肉、豆制品、蔬菜、汤、牛奶、水果和调味配菜等多个组成部分。这已经比“识别一根香蕉”或者“识别一碗白米饭”复杂得多。

读论文时不要忽略这一点需要注意：这是一种接近“理想实验室环境”的测试。真实生活中的光线、拍摄角度、外卖酱汁、家庭炒菜和混合菜肴往往更加复杂。

02 AI 与谁进行比赛？

研究团队邀请了 10 名具有 5 年以上医院营养管理经验的注册营养师，让他们仅根据餐盘照片，估算每顿饭的热量和三大产能营养素。与此同时，研究者也测试了 10 种 AI 模型或营养评估应用。

● 通用型多模态模型：ChatGPT-4o、Gemini 1.5 Pro、Claude 3.5 Sonnet、Gemini 1.5 Flash；

● 营养评估应用：Foodita、Calomil、Asken、FiNC、OWN、CALO mama Plus；

● 统一要求：根据图片估算能量、蛋白质、脂肪和碳水化合物，并输出具体数值。

“研究者没有告诉 AI 菜名，也没有补充食材、克数、烹饪方式和调味信息。AI 只能“看图猜答案”。”

经过初步筛选，热量估算表现较好的三个模型进入后续重点分析：ChatGPT-4o、Gemini 1.5 Pro 和 Foodita。

03 先看懂四个指标，才不会被“高相关性”误导

阅读这篇论文，需要区分四种不同含义：

✓ 相关系数 r：判断 AI 能否识别不同餐盘之间的高低变化。相关性高，不代表每一顿饭都算得准。

✓ 平均绝对误差 MAE：反映每次估算平均差多少。

✓ 平均偏差：判断 AI 更倾向于高估还是低估。

✓ 误差在±10% 以内的命中率：最直观地反映结果是否具有实际使用价值。

举例来说，一个 AI 即使每次都高估 100 千卡，也可能拥有不错的相关性。因此，营养师不能只看一个 r 值，就直接得出“AI 已经算准了”的结论。

营养指标	注册营养师	ChatGPT-4o	Gemini 1.5 Pro	Foodita
热量：±10%命中率	86.7%	73.3%	60.0%	46.7%
蛋白质：平均偏差	-3.5%	+10.6%	+17.7%	+20.8%
脂肪：平均偏差	+13.1%	+52.3%	+33.8%	+36.9%
碳水：平均偏差	-7.2%	-12.8%	-13.9%	-11.2%

注：数据整理自论文第 6 页 Table 2。正值表示高估，负值表示低估。

04 热量估算：AI 已经进入“可辅助使用”阶段

15 份医院餐的真实平均热量为 605.2 千卡。注册营养师的平均估算值为 589.8 千卡；ChatGPT-4o 为 593.0 千卡；Gemini 1.5 Pro 为 587.6 千卡；Foodita 为 599.2 千卡。

图 2｜热量估算误差在 ±10% 以内的餐次占比。数据整理自论文第 6 页 Table 2。

从平均值看，三个表现较好的 AI 模型都比较接近真实结果。注册营养师仍然更加稳定，但 ChatGPT-4o 已经显示出一定实用价值：15 份餐食中，有 73.3%的热量估算误差控制在±10% 以内。

对于标准化餐食的初步筛查、日常记录和趋势监测，AI 的热量估算已经不是“玩具级”能力，而是逐渐进入可以辅助工作的阶段。

05 碳水化合物：趋势判断不错，但不能过度乐观

为什么 AI 对热量和碳水化合物的估算相对更好？一个重要原因是：主食通常具有比较明显的体积。一碗米饭、一片面包、一份面条，视觉上相对容易识别。

在这项研究中，很多餐食都包含 200 克米饭。对于 AI 而言，这种标准化摆盘能够提供相对稳定的视觉线索。

但需要看到另一面：ChatGPT-4o 的碳水化合物平均偏差仍为 -12.8%。这说明它可以大致识别餐盘之间的高低变化，却仍可能系统性低估。

临床提示在糖尿病患者碳水化合物计数、胰岛素剂量匹配或特殊疾病饮食管理中，单纯依靠图片识别仍然不够稳妥。

06 蛋白质：临床场景要警惕持续高估

与米饭相比，蛋白质的判断困难得多。因为蛋白质并不是一种可以直接“看见”的物质。

同样是一块肉，它可能是鸡胸肉，也可能是鸡腿肉；可能是瘦牛肉，也可能夹杂脂肪；可能是鱼肉，也可能是裹粉油炸之后的鱼排。豆腐、鸡蛋、鱼肉、肉末和混合菜肴，也会进一步增加识别难度。

研究结果显示，AI 对蛋白质存在不同程度的高估：ChatGPT-4o 平均高估 10.6%，Gemini 1.5 Pro 平均高估 17.7%，Foodita 平均高估 20.8%。

对于普通人来说，一顿饭多估几克蛋白质，未必立刻造成严重影响。但在老年人肌少症管理、肿瘤营养、术后康复、肾脏疾病、重症营养和儿童生长发育评估中，持续高估可能让营养师误以为患者“吃得还可以”，从而忽略真正存在的摄入不足。

07 最大的问题：AI 很难看见“油”

这篇论文最值得关注的发现，是脂肪估算。15 份餐食的真实平均脂肪含量为 13.0 克。注册营养师估算为 14.7 克，ChatGPT-4o 估算为 19.8 克，Gemini 1.5 Pro 为 17.4 克，Foodita 为 17.8 克。

图 3｜脂肪估算的平均偏差。ChatGPT-4o 平均高估 52.3%。数据整理自论文第 6 页 Table 2。

“真实脂肪如果是 13 克，ChatGPT-4o 平均会估算到接近 20 克：脂肪平均高估 +52.3%。”

为什么会出现这么明显的误差？因为油脂经常是餐盘中的“隐形营养素”。我们可以看到一块鱼，却很难仅凭照片判断它用了多少油；可以看到一盘蔬菜，却不知道它是清炒、焯拌，还是加入了芝麻酱和蛋黄酱；可以看到酱汁，却很难判断里面究竟包含多少糖、油和淀粉。

论文作者将这种问题概括为“invisible nutrient bias”，也就是“不可见营养素偏差”。这是一个非常值得营养师记住的概念。

“AI 的视觉识别能力再强，也不代表它能够看见图片中没有呈现的信息。AI 不是不会计算，而是缺少关键输入。”

08 这篇论文不是在证明“AI 可以替代营养师”

看到这里，有人可能会问：既然 AI 估算热量已经比较接近注册营养师，是不是以后营养师就不需要做膳食评估了？答案显然不是。

● AI 表现较好的场景，是摆盘规整、光线稳定、主食分量相对固定的标准化医院餐。

● 真实世界中的家庭饮食、外卖、聚餐、火锅、盖浇饭、麻辣烫、浓稠酱汁和混合菜肴会进一步增加估算难度。

● 研究评估的是完整餐盘，而临床真正关心的是患者吃下去多少、剩下多少、连续几天有没有下降，以及是否需要进一步干预。

更重要的是，注册营养师并不是一台“更慢的营养计算器”。营养师真正重要的价值，是根据患者疾病状态、饮食习惯、治疗方案、营养风险和执行能力，判断什么信息重要，什么结果需要复核，以及下一步应该采取什么行动。

09 更合理的工作方式：营养师带着 AI 工作

这篇论文真正有价值的地方，不是宣布 AI 战胜了营养师，而是清楚地告诉我们：AI 最适合处理标准化、重复性强、可以被结构化的工作。

AI 可以帮助营养师完成这些工作：

✓ 根据餐盘照片进行初步识别，快速估算热量和主要营养素；

✓ 生成饮食记录初稿，对比连续多天的摄入变化；

✓ 标记可能存在摄入不足的餐次；

✓ 提醒营养师重点复核脂肪、蛋白质和混合菜肴；

✓ 根据预设规则生成复诊前的追踪清单。

但在真正用于临床或健康管理之前，还需要加入菜名、食材构成、大致重量、烹饪方式、是否使用油或酱汁、是否吃完、剩余比例、患者疾病情况和营养目标。

“AI 负责快速整理、初步估算和发现线索；营养师负责设定目标、补充信息、识别风险、解释结果和做出判断。”

这就是更加合理的 Human-in-the-loop 模式：人类始终参与其中。

10 阅读论文时，还需要保持一点专业谨慎

● 研究仅测试了 15 份标准化医院餐，样本量仍然较小。

● 拍摄条件接近理想环境，真实家庭场景可能更加复杂。

● 研究主要评估热量和三大产能营养素，没有覆盖膳食纤维、钠、钾、钙、铁和维生素等指标。

● AI 模型版本更新速度很快，这篇论文反映的是特定时间点的能力快照。

“不要只看摘要中的一句“AI 表现接近营养师”，更要看它在哪些指标上接近，又在哪些指标上仍然存在明显短板。”

11 对营养师来说，真正值得思考的是什么？

AI 营养评估正在快速发展。但营养师没有必要把问题简化成：“AI 会不会取代我？”

更值得思考的问题是：“我能不能把 AI 放到正确的位置上？”

AI 可以帮助营养师减少大量重复劳动：整理客户资料、生成初步评估框架、协助文献检索、提取论文重点、制作科普内容、生成课件初稿、整理复诊数据，以及建立标准化服务流程。

“AI 看得见米饭的体积，却未必看得见锅里的油。营养师真正不可替代的价值，是知道什么时候可以相信 AI，什么时候必须再追问一句：“这道菜到底是怎么做的？””

12 我为什么越来越重视营养师的 AI 实战能力？

这也是我持续打磨“飞哥营养师 AI 实战训练营”的原因。飞哥营养师AI实战营2.0来了：专为0基础营养师设计，不讲玄学，只讲落地！

我希望带大家学习的，不只是几个好玩的工具，也不是背诵几条固定提示词。真正重要的是，把 AI 放进营养师每天真实发生的工作场景中。

飞哥营养师 AI 实战训练营，重点关注这些真实场景：

✓ 文献检索、论文解读与专业内容提炼；

✓ 公众号科普、小红书笔记与专业 IP 内容创作；

✓ PPT、信息图与营养师视觉表达；

✓ 客户资料预审、首诊提纲与复诊追踪清单；

✓ 临床营养工作提效、专病营养服务与团队 SOP；

✓ 营养师专属 Skills、轻量 Coding 与 AI Agent 工作流。

“少一点混乱，多一点结构；少一点临时发挥，多一点专业沉淀；少一点机械劳动，多一点真正有价值的服务。”

未来更有竞争力的营养师，未必是最早追逐每一个新工具的人。但一定是能够把专业知识、服务经验和 AI 工作流真正结合起来的人。

AI 可以帮助我们走得更快。营养师的专业判断，决定了我们最终走向哪里。

参考论文信息与声明

飞哥推荐营养师AI时代必读文章：

飞哥营养师AI实战营2.0来了：专为0基础营养师设计，不讲玄学，只讲落地！

六一特别策划｜儿童营养门诊AI智能助手正式开售：把 AI 变成儿童营养师的门诊搭档！

135491 顿饭训练出的 AI，发现了一个更容易坚持的健康饮食方法

专为体重管理营养师制作的skill——减脂平台期分析助手上线啦！

营养师专用 AI Skill 来了：第一个肠道微生态营养咨询助手上线！

专为体重管理营养师制作的skill——减脂平台期分析助手上线啦！

专为营养师打造的小红书内容引擎skill上线了！让营养师更快追热点、做内容！

飞哥营养师 Skills 开卖了：三日饮食记录分析 Skill 正式上线！

营养师必看！AI从真实世界用药帖里，挖出了 GLP-1 最容易被忽视的身体信号

1万名注册营养师 × AI Agent，撑起17亿融资：营养师的下一个分水岭来了！

京东618把 AI 营养师放进服务闭环：营养师的分水岭，真的来了！

AI已经干临床营养了！

AI已经干孕期营养教育了！

AI已经能辅助碳水计数了，营养师还只用它写文案吗？

AI时代，营养师必须补上的一课｜2026美国营养师协会&美国营养学会《注册营养师AI与机器学习指南》全文首发全译

难以置信！AI 能从心理状态预测肌少症？