你好,我是刘坏坏。
小龙虾(OpenClaw)的热度降下来了,以它为代表的 AI 智能体号称能「帮你动手做任何事」。
搭配层出不穷的各种 Skills,它们能完成诸如回复消息、浏览网页、搜索调研、定时任务等程序性操作。
甚至完成上述操作时,它是拥有一定自主决策能力的。
这也是它们火出圈的原因。
越来越多的人开始养龙虾,二手 Mac Mini 都被带涨价了,就在昨天中午,我还差点下单一台,还好忍住了…
搞一台机器,养几只龙虾,让它们 24 小时给自己打工,从此躺着数钱。
这是大家理想中,小龙虾之类 AI 智能体最终能实现的神迹。
谈完理想,不得不回到现实:现阶段,你的龙虾干活越勤奋,你的钱包空得越快。
小龙虾根本养不起啊!
AI 时代,词元(Token)已经成了如数据流量般的存在。
它不可或缺,但现阶段并步入寻常百姓家。
十几年前,手机流量按兆(M)买,我记得很清楚,2008 年,中国移动,30M 流量,每月 5 块钱。
现在,没个几十几百 G 流量,通讯公司都不好意思往外出套餐。
现在的 Token 就像十几年前的流量一样,一样贵。
词元一定会越来越便宜,但它和数据流量不同的是,它没有被国企垄断,而是掌握在科技公司手中。
谁的算力高,谁就掌握了 AI 时代的生产力。
这是 AI 时代的底层经济学逻辑。
你以为买个低功耗的 Mac Mini 就能省钱了?
传统软件再销金,消耗的无非是你的电费,但 AI 软件完全不一样。
AI 智能体本身没有脑子,它要干活,必须把你的指令、输入的文件全部打包成 Token,通过 API 发给云端的「大脑」去处理。
大模型坑就坑在这里,它的计费逻辑是 按 Token 算钱,双向收费。
什么意思?意思是输入要钱,输出也要钱。
睡一觉醒来,小龙虾「贴心的」给你整理好了你感兴趣新闻、把你的未读通知做了归类,并替你评估了主次、做了几次定时任务巡检…
很勤奋吧!赛博牛马也不过如此吧!
但一看 API 消耗,你两眼一黑。就这消耗量,Anthropic 都顶不住,你顶得住?
为了让自己看起来像个 24 小时在线的「贾维斯」,OpenClaw 之类的智能体有两个坑爹机制:心跳机制和无限记忆机制。
心跳机制 很容易理解,字面意思,它会每隔一段时间,几分钟、十几分钟主动「醒来」一次,去看看有没有新消息、新任务。即便啥事儿没有,它也得把大模型叫起来问一句「你在吗?」这一问,前就没了。
无限记忆机制 是它「聪明」的关键,它为了记住你的喜好,会把你们所有的聊天记录存为 Markdown 文件,下次再聊,它会带着这个越来越大的文件去请求大模型。
想象一下,几天之后,你的小龙虾带着几十万字的上下文去问大模型「你在吗?」,这单次请求的成本是呈 指数级 爆炸上升的。
你的 Token 就是这么烧没的。
我找了个第三方 Claude API,有个赠送的 5 美刀额度,我把我的虾子大脑换成这个 API,问了一句「你在吗?」,余额变成了 -1.27刀,有图有真相:

赶紧删号跑路…
为了省掉这笔费用,不少人开始选购顶配的 Mac Mini,动手攒高性能 PC,在本地跑开源大模型。
但开源模型怎么能和商业级旗舰模型比?
牛逼的算力设备不在此列,你买得起的话,就不在乎大模型的 API 消耗了。
于是一只只智障虾诞生。
受不了本地烧机的,扭头去租算力服务器,不谈供应商跑路,一旦被恶意扫描到,或者卡到逻辑死循环里,流量和 CPU 直接拉满,账单同样能让你怀疑人生。
用 AI 全自动干活。
听起来很性感,但在成本降到白菜价之前,你必须得建立这样的习惯:
小事用免费劳动力,大事请专家。
总结新闻、定时检查任务状态,让 AI 写个不用 AI 的脚本就行了,只有真正需要深度思考、调研、决策、思维碰撞、头脑风暴的事情,再用顶级模型,这叫 「云边协同」。
定期记忆斩断。
别让 AI 智能体存这么多聊天记录,常用 /reset 命令强制清空短期记忆,或者用第三方插件/技能提取关键信息,轻装上阵。
设置物理熔断器。
在 API 后台设置好硬性规定的每日消费上限,哪怕停机不干活,也比醒来发现欠了 200 刀要强。
搞一人公司,拼的不是谁 AI 用的溜,是谁能通过 AI 加持让自己的业务赚的更多。
Token 是下个时代的真金白银,而此刻,AI 智能体这一只只吞金兽正肆意生长。
刘坏坏 丙午年二月廿一
夜雨聆风