我用了 2小时设计了一个 AI 牛马饲养员
然后用 5 分钟把它毙掉了
—— 一份关于 AI 选品的自打脸复盘

PRODUCT REVIEW · 2026.06
摘要 / ABSTRACT
本文记录了一个 AI 饮食日报机器人从需求洞察、可行性预判、MVP 实现到自我否定的完整过程。作者用 2 小时完成了产品定义、人设设计、飞书机器人对接与上线测试,并在第一次上手体验后判定其为"失败选品"。本文意在还原"AI PM 杀掉自己产品"的真实推演路径,为同类型产品的早期评估提供反面教材。
AI 时代有一个不成文的潜规则:提出一个 AI 产品概念只需要 30 秒,但识别它是否值得做需要 3 年。大部分人停在前 30 秒——开个会、写个 PPT、说一句"这个方向很有想象空间",然后散会。
我决定换一种活法。把"概念"推到"能跑的最小产品",然后用一个真实的工作日去用它。如果用着用着觉得不对,就立刻杀掉,不留情面。
这是第一次实验。主角叫"牛马饲养员",一个想喂饱大厂打工人的 AI 饮食日报机器人。从兴致勃勃到亲手枪毙,全程 2 小时 5 分钟。
01 | 需求洞察
一个看起来"绝对成立"的痛点
起点是一个非常具体的画面:周三晚 11 点,我刷朋友圈,看见三个大厂的前同事,几乎同一时间发了三张完全不一样的烧烤摊照片,文案出奇一致——"今天又是被需求虐成狗的一天。"
那一刻我有一个非常清晰的判断:大厂打工人是一群"明知自己在被胃透支,却没人盯着"的人。他们什么都懂——外卖不健康、咖啡太多、宵夜致命,但他们没有一个能持续看见这些事实的镜子。
我把痛点拆成三句话:
① 大厂打工人饮食极度不规律,但缺乏低门槛的记录工具;
② 市面上的健康类 App 体验过于沉重,要称重、要拍照、要选食物库;
③ AI 大模型对"模糊文字描述"的理解力,刚好能解决这个录入门槛。
一组看起来"足够撑腰"的案例
我没有立刻动手,而是花了 20 分钟做行业扫描,想找些既有玩家做参照:
表 1 · 全球同类玩家速览
MyFitnessPal(美国)
巅峰日活 1500 万,被 Under Armour 以 4.75 亿美元收购,但 2024 年日活已跌至约 600 万。
Cal AI(2024 美国新秀)
仅靠"拍照识别热量"单功能,2024 年 ARR 突破 4000 万美元,被认为是 AI+健康赛道现象级。
薄荷健康(中国)
连续融资 6 轮,2023 年改名"薄荷营养"切入电商,承认工具变现极难。
Keep · 饮食模块
作为站内补充功能存在,独立日活长期未对外披露,行业普遍认为留存远低于运动模块。
数据指向一个矛盾的结论:"AI+饮食"既有 Cal AI 这种爆款,也有 MyFitnessPal 这种慢性失血。当时我天真地下了判断——Cal AI 能爆是因为它解决了"录入门槛",那么飞书机器人 + 自然语言录入,理论上门槛更低。
可行性,初评:PASS。
02 | 产品设定
把"概念"压成"能跑的 MVP"
接下来 2 个多小时,我把它推到了能上线测试的状态。整体设计分成四层:
A · 人设层
"饮食搭子"而非"营养师"。性格定位:黑色幽默+毒舌损友+不上价值,禁用"建议您"、"应该"等 AI 模板腔。
B · 输入层
飞书机器人接收自然语言。"中午鱼香肉丝盖饭+冰美式"这种半口语化文字直接进,不做表单、不查食物库。
C · 处理层
大模型对食物做粗范围估算(盖饭≈800kcal)、识别跳餐/宵夜/咖啡过量等异常信号,存入飞书多维表格。
D · 输出层
日报:当晚 20:00 自动 push 三段(吃了啥/致命伤/损友一句话);周报:按 6 模块结构生成。
技术栈选择:能少做就少做
技术栈我刻意选了"几乎不用写代码"的路径——这是 MVP 应该有的样子:
- 扣子(Coze)
承担 Agent 主体与人设管理 - OpenClaw 网关
承担多渠道接入,长连接 WebSocket 直连飞书 - 飞书自建应用
作为载体,零安装、零下载 - 飞书多维表格
作为数据库,免运维
实际跑通的时间成本:人设 SOUL.md 写作 5 分钟、机器人头像生成 5 分钟、 Agent 配置 30 分钟、OpenClaw 网关对接 10 分钟、飞书后台权限调试 10 分钟。合计约 2 小时,最终上线时机器人能在群里正常应答、识别外卖描述、给出毒舌点评。
周报输出样例:长这样
为了把"产品到底长什么样"说清楚,我先用手工方式打了一份周报样例——这也是 MVP 阶段对"输出契约"的锁定:机器人收满一周数据后,应该往群里 push 的就是这种东西。

图 1 · 牛马饲养员周报输出样例(手工标定版 · MVP 输出契约)
这张样例其实回答了三个问题:第一,AI 输出到底是冷冰冰的数字罗列,还是带情绪的"损友说话"——我选了后者;第二,健康风险用医学化语言还是黑色幽默——我选了后者;第三,建议要给"专家口吻"还是"哥们口吻"——我选了后者。整张周报的语气标尺,就这么定下来了。
回头看,这张样例越精致,后面被打脸越响——产品做得好看,不代表选品做得对。这一点我们留到第三部分。
关键观察 · 从概念到能跑通,AI 时代的产品冷启动成本,已经被压到了一个产品经理一个下午能搞定的量级。这本身就是巨大的产业变量。
03 | 上手体验
五条致命问题,按出现顺序排列
上线之后我自己用了大约半个工作日。问题是按顺序冒出来的——每出一个,都比上一个更扎心。
问题①:日报本身就是个"已知信息的复述"
晚上 8 点,机器人把我一天吃的东西总结给我看。我对着屏幕愣了两秒——这些事我自己心里全知道。它把"我吃了什么"还给我,没有创造任何新信息。事后总结类产品的铁律:用户看一次新鲜,看三次无聊,看五次取关。MyFitnessPal 从日活 1500 万跌到 600 万,本质就是这个原因。
问题②:手动输入这件事,超出大厂打工人的意志力
第一天我还能记得每顿都发,第二天午饭我就忘了。行业平均:依赖主动输入的健康类应用,7 日留存 <15%,30 日留存 <5%。飞书机器人比 App 方便那么一点,但本质没变,如果最小mvp用app实现那么前期投入更大但最终验证的结论是一致的——只要"输入"这个动作存在,用户就一定会跑。Cal AI 之所以能爆,恰恰是因为它把输入降级成了"拍一张照片"。
问题③:用户错了——大厂打工人压根不是好用户
我后来翻 Cal AI、薄荷健康、Keep 的真实用户画像,发现一个反直觉事实:真正愿意每天输入饮食的人,是备孕女性、减脂人群、慢性病患者、孕妇——他们有强动机,他们会自己求着 App 让他们输入更多。大厂打工人有的只是"我应该关心一下健康"的负罪感,扛不过三天。我把客户搞错了。
问题④:价值主张错了——健康不是大厂打工人的最痛
我换位思考了一下:如果机器人不告诉我"你今天热量超了 30%",而是告诉我"你这个月点了 77 顿外卖,花了 2680 块,相当于多上 4 天班"——我会不会更想看?答案是显而易见的。大厂打工人对透支身体有心理预期,但对"钱没攒下来"敏感得多。我打错了情感钩子。
问题⑤:没有反馈循环,输入完就完了
我点了外卖、发给机器人、它回了一句损话。然后呢?下一次点外卖的时候我根本不会想起它。没有反馈循环 = 没有行为改变 = 用户没有长期留下来的理由。Cal AI 把反馈做成了"今天还能吃多少",每次点餐前看一眼;我做的是"今天已经吃了什么",事后冷饭。
综合判断 · 5 条问题里,①②⑤ 是产品形态死局,③④ 是定位失误。前者无法靠改 prompt 修复,后者意味着即便修复了形态,方向也错了。结论:判定为失败选品,建议立刻枪毙。
04 | 经验沉淀
四条可迁移的 AI 选品教训
枪毙一个产品比孵化一个更难。但这次实验让我留下了四条以后会反复用到的判断标准。
教训一:警惕"事后总结"型产品
AI 时代有一类很容易被想到的产品:让 AI 帮你总结你已经做过的事。这类产品几乎都有同一个问题——用户已经知道答案,AI 的总结只是赘述。有些场景稀缺的是"事前决策辅助"和"事中实时反馈",有些需要相互结合。
教训二:"输入门槛"是 AI 产品的隐形杀手
AI 大模型让"理解模糊输入"变成了零成本,但"启动输入"本身的意志力消耗,AI 没办法降低。真正的 AI 产品突破,往往出现在"把输入动作压到趋近于零"的地方——拍照、OAuth 授权、API 直连。能不让用户输入就不让。
教训三:找有"强动机"的用户,而不是"应该有动机"的用户
大厂打工人"应该"关心健康,但他们没有强动机。备孕女性"必须"关心饮食。"应该"和"必须"中间隔着 95% 的留存率。AI PM 在选品时最大的诱惑就是选"看起来很多人需要"的市场,但真正能跑通的是"少数人非用不可"的市场。
教训四:选品时优先选"情感钩子精准"的方向
"健康"是一个泛情感钩子,"省钱"是一个精准情感钩子。同样是饮食数据,挂在哪个钩子上,价值差 10 倍。AI 时代功能复制几乎无门槛,真正的差异化在于:你把同样的能力,挂在用户哪根神经上。
— 结 语 —
牛马饲养员从启动到枪毙,全程 2 小时 5 分钟。但它留下的四条教训,会跟我跑完接下来所有 AI 选品实验。
AI 产品经理的核心竞争力,从来不是"我想到了多少 AI 应用方向",而是"我能多快识别出哪些方向不值得做"。30 秒提出概念的人比比皆是,5 分钟敢杀掉概念的人才稀缺。
💬 互动 · 留言区
如果让你给"AI+饮食"这个方向重新出一份选品方案,你会从哪个用户/钩子/输入方式切入?欢迎在评论区留下你的思路。下一篇我会公布一个"我自己愿意付费用"的新版本设计。
被 AI 追着跑的 IT 人小登 · Vol.07
夜雨聆风