免费时代,AI用多用少无所谓。付费时代,不会消除浪费的人,花多少钱都不够。
01 两个信号,同一个方向
信号1:Gemini限额了。
5月19日,谷歌悄悄上线"动态算力扣减机制"——不再限制聊天条数,而是按实际算力消耗扣额度。每5小时一个周期,还有周总额度上限。用超了?账号直接锁定,等下周。
信号2:DeepSeek永久降价到1/4。
5月23日,DeepSeek宣布V4-Pro模型API价格永久调整为原价的1/4。输入3元/百万tokens,输出6元/百万tokens。
一升一降,方向很明确:AI行业开始算账了。 免费烧钱拉用户的阶段过去了,接下来是"你用多少,付多少"的精细化时代。
这不是暂时的调整,而是结构性转变。背后是资本市场的压力:烧了四年千亿美金,投资人不再满足于"用户增长",要看到实打实的利润。OpenAI据说最快本周五提交IPO申请,对盈利的渴望只会更强烈。
AI的"免费午餐"时代,可能真的结束了。
02 为什么大部分人会吃亏?
免费时代,AI用多用少无所谓。写个周报让AI改5遍?没问题。让AI生成20个标题再挑1个?随便。一个问题问3次因为前两次不满意?没关系。
但付费时代,这些行为全变成了真金白银。
我用精益的框架,把"AI使用浪费"分成4种:
| 重复浪费 | ||
| 过度加工浪费 | ||
| 上下文浪费 | ||
| 工具浪费 |
这4种浪费,在免费时代无所谓。在付费时代,不会消除浪费的人,花多少钱都不够。
03 大厂已经踩过坑了
个人用户还在焦虑"额度不够用"的时候,大厂已经把坑踩出规模了。
Meta踩油门: 上线Token消耗排行榜,把用量和考核挂钩,给高用量员工授予"Token传奇""缓存魔法师"等荣誉。结果?全员Token消耗从6万亿暴涨到73.7万亿,12倍增长,AI消耗彻底失控。因为Token消耗和业务产出没有直接关系,员工只是疯狂刷量。
Uber踩刹车: 95%的工程师常态化使用AI编码工具,单人每月AI调用成本达500-2000美元。结果?2026全年AI预算,4个月就花光了。CTO公开坦言预算透支。
微软急转弯: 6月底关停大部分Claude Code授权席位,全面切换至自家GitHub Copilot CLI,核心诉求就是缓解AI成本压力。
百度李彦宏说了句大实话:"Token好统计,但不等于实际产出。"
这不就是精益里说的**"可测≠有价值"**吗?
大厂亏的是几亿美金,你亏的是每月的订阅费和额度。逻辑完全一样。
04 精益用AI,3步止血
别慌,解决方案很简单。精益的核心不是"少用",而是**"用在刀刃上"**。
第1步:做一次"AI使用价值审计"
回顾你过去一周用AI做的所有事,给每一条打标签:
- 高价值
:没有AI你做不了/要花10倍时间的 - 中价值
:AI帮你省了时间,但你自己也能做 - 低价值
:让AI做了,但结果还要大改的
低价值的使用,就是你的浪费清单。 先从这些开始砍。
一个简单判断标准:如果AI输出结果你改了超过50%,这次使用大概率是低价值的。不是AI不行,是你给的指令不够精准——这本身就是一种浪费。
第2步:按任务选模型,别一律用最强的
DeepSeek降价到1/4不是让你更随意地用——而是让你在合适的场景用便宜的模型。
这就好比丰田不在每个工位都用最贵的设备——按需配置,才是精益。
Gartner有组数据:完成同等任务量,Agent的Token消耗是传统聊天机器人的5-30倍。这意味着,如果你用Agent模式做简单任务,你在以5-30倍的代价做一件轻量模型就能搞定的事。
第3步:建立你的"AI提示词标准库"
每次重复解释背景=上下文浪费。解决方法:
把常用背景信息存成模板,每次新对话直接粘贴 把验证过好用的提示词存下来,不要每次从零开始 一次性给够上下文,不要来回补充(来回补充=多次调用=多倍token)
这3步的本质,就是精益的"消除浪费":先识别浪费(审计),再按需配置(选模型),最后标准化流程(提示词库)。
和丰田100年前做的事一模一样:不是减少生产,而是消除生产中的浪费,让每一分投入都产出价值。
05 更大的图景:从"用量崇拜"到"效率度量"
大厂的Token KPI翻车,本质上是一个精益问题:把过程指标(Token用量)当成了结果指标(业务价值)。
这和传统制造业的"产量崇拜"一模一样——只看生产了多少,不看卖出去多少、赚了多少。
精益的解法是:建立价值流,让每一笔消耗都指向可衡量的产出。
李彦宏提出用DAA(Daily Active Agent)替代Token消耗——从"烧了多少"到"跑了多少",算往前走了一步。但"值多少"这个问题,精益人知道答案:价值=客户愿意付费的产出,而不是你投入了多少资源。
06 终局思考
AI免费时代的逻辑是"能用就用"——用多用少不心疼。
AI付费时代的逻辑是"用对才用"——每一笔都有成本,必须花在价值上。
这个转变,精益100年前就经历过。
从"大量生产"到"精益生产",不是减少生产,而是消除浪费,让每一分投入都产出价值。
从"免费AI"到"付费AI",不是少用AI,而是消除浪费,让每一笔Token都花在刀刃上。
AI开始算账了。你也该开始了。
王老五,精益+AI实践者
知乎/小红书搜索"精益王老五"
公众号"王老五AI实操应用笔记"
用精益视角,看懂AI时代每一次变革
互动话题:你现在用AI最大的浪费是什么?评论区聊聊,我帮你出主意👇
夜雨聆风