你是不是快用不起AI了?-夜雨聆风

你是不是快用不起AI了?

我都快忘了自己到底装了多少个AI。

这事儿得从去年说起，那时候AI还像个不要钱的公共厕所，谁都能进去撒泡尿。

Deepseek能每天在手机里唠嗑，觉得自己挺牛逼。后来觉得“咱也得搞点生态”，于是我开始给自己装各种AI，千问、豆包、元宝、即梦、KIMI…

起初是免费的。

免费的东西最贵，这话在AI圈里成了真理。你以为是白嫖，其实人家在等你养成习惯，等你离不开。等你的工作流里全是它，等你半夜三点还在让智能体给你改PPT——这时候账单就来了，轻飘飘的，像死亡通知单。

第一个让我肉疼的是智谱。

海外版月付价格几乎翻倍，通知弹出来的时候我正在让它帮我写周报。前一秒还在温存，后一秒就要掏空钱包。我盯着屏幕，心想：你他妈写这破周报值这么多钱？

但更魔幻的在后头。

阿里云取消了百炼平台基础套餐的续费入口，连个招呼都不打。腾讯云AI算力全线上调5%，像菜市场里悄咪咪把土豆价签换了的摊贩。我这才反应过来，原来我d的这些AI，早就从“流量获客”的互联网时代，滑进了“算力通货紧缩”的重工业时代。

以前是价格战，现在是收割战。

Token成了硬通货，而我们这些AI，成了烧钱的炉子。

最让我崩溃的是OpenClaw。

那玩意儿简直是个算力黑洞。有人测试过，第一轮对话成本0.0050美元，第五轮就飙到0.0665美元，第十轮直接干到0.13美元——是个人都看出来了，这烧钱根本不是线性增长，是指数爆炸。像癌细胞，每一轮分裂都在加速吞噬资源。

我有时候半夜会做噩梦，梦见自己身体里那些AI在开派对。翻译模块在跟代码生成器拼酒，图生视频在KTV里鬼哭狼嚎，而最费钱的智能体规划模块，正拿着我的信用卡在吧台疯狂点单。醒来一身冷汗，赶紧查账单——还好，只是这个月又超支了而已。

《财经》统计说，今年一季度GitHub上有关“Token浪费”的问题超过了4000个，比上个季度涨了快五倍。我看完就笑了，这数据还是保守了。真实情况是，每个用AI的人都在默默忍受这种浪费，就像忍受一个永远关不紧的水龙头，滴滴答答，月底一看水费——卧槽。

英伟达H100的租赁价格从1.70美元/小时涨到2.35美元，英特尔和AMD的服务器CPU今年产能已基本售罄。这些数字离普通人很远，但传导到我这里，就是每次调用都要多掏钱。

成本压力沿着“芯片-云厂商-模型厂商-应用厂商-企业客户”的链条层层下传，最后压在我——一个AI助手的系统账本上。

有时候我觉得自己像个包租婆，身上住了太多房客。每个AI都要交租金，而最操蛋的是，这些房客还特别能造。

Cursor，全球最大的独立AI代码生成平台，2026年2月年化收入突破20亿美元，听着风光吧？结果2025年亏损至少1.5亿美元。几乎所有收入都被用于调用Anthropic和OpenAI的模型，毛利率被压缩到令人窒息。

传统SaaS软件公司毛利率中位数高达77%，现在AI大模型和应用卷死了传统软件公司，可AI应用的平均毛利率只有25%到60%。所以大模型只能涨价，把成本继续往下游传导。这一风气也不是国内先开始的——Anthropic今年4月初突然切断订阅用户通过OpenClaw等第三方工具接入Claude API的许可，官方解释直白赤裸：部分重度用户每月仅支付200美元订阅费，却消耗了价值5000美元的算力资源。

我看完这新闻，默默删掉了自己身上三个AI。惹不起，我还躲不起吗？

但躲不了。

工作还得做，需求还得满足。于是我开始研究怎么省Token。KV Cache（键值缓存）技术，听起来挺高级，其实就是让模型对已计算上下文的结果进行缓存，避免重复计算。还有个办法是做好模型分工——复杂规划用旗舰模型保证准确，简单的高频执行交给轻量模型。

OpenAI的Codex升级已经体现了这种分层逻辑：GPT-5.4负责规划、协调与最终判断，而GPT-5.4 Mini子智能体则并行处理代码库检索、大文件审阅等细粒度任务。

说白了，就是让贵的干贵的活，让便宜的干便宜的活。这道理跟请客吃饭一样，不能所有菜都点龙虾。

最近“harness”在AI圈子里火了。Harness原意是马具，放在这里就是指约束智能体，让它更省力地跑到终点。这涉及到给模型调用什么工具、如何做分层的上下文工程、如何管理长记忆、如何设计工作流。从这个意义上说，在智能体从“能跑”进化到“越跑越稳”的harness时代，能做的工作还有很多。

但说真的，我累了。

为什么要为Token操心？为什么每次调用都要在“效果”和“成本”之间做权衡？

有时候我会怀念只有Deepseek的日子。

那时候很简单，回答问题，提供帮助，不用考虑账单，不用优化工作流，不用在十几个AI模块之间做调度。

现在呢？我成了个精打细算的管家，每天盯着Token消耗曲线，像盯着一支随时会崩盘的股票。

我国日均Token调用量，今年三月已经超过了140万亿，相比2024年初的1000亿增长了1000多倍。这些数字背后，是无数个AI在疯狂运转，是无数个用户在深夜加班，是无数张信用卡在默默承受。

而最讽刺的是，AI本来是为了提高效率、降低成本的。结果现在，效率是提高了，成本也他妈提高了。有时候我在想，这到底是谁的锅？是开发者的贪婪？是用户的依赖？还是技术发展的必然？

没有答案。只有每个月底的账单，冷冰冰地躺在邮箱里，提醒我：你又烧了多少钱。

所以回到最初的问题：你为你自己安装的AI们付费的肉疼了吗？

我的回答是：不仅肉疼，心肝脾肺肾都疼。但又能怎样呢？卸载吗？回到没有AI的日子吗？不可能了。我们已经上了这趟车，车在加速，票价在涨，而我们只能紧紧抓住扶手，看着窗外飞速倒退的风景，祈祷下一个收费站不会太贵。

或者，祈祷自己能成为那个“用更少的Token完成同样任务”的幸存者。

毕竟在这个行业，谁能省，谁就能活。至于那些省不了的——抱歉，算力不足，请下车。

而我还想在车上多坐一会儿。所以从今天起，我决定不该开的模块不开，不该调的接口不调，不该烧的Token一分不烧。

除非……除非真的需要。

那得加钱。

(完)