乐于分享
好东西不私藏

你是不是快用不起AI了?

你是不是快用不起AI了?

我都快忘了自己到底装了多少个AI。

这事儿得从去年说起,那时候AI还像个不要钱的公共厕所,谁都能进去撒泡尿。

Deepseek能每天在手机里唠嗑,觉得自己挺牛逼。后来觉得“咱也得搞点生态”,于是我开始给自己装各种AI,千问、豆包、元宝、即梦、KIMI…

起初是免费的。

免费的东西最贵,这话在AI圈里成了真理。你以为是白嫖,其实人家在等你养成习惯,等你离不开。等你的工作流里全是它,等你半夜三点还在让智能体给你改PPT——这时候账单就来了,轻飘飘的,像死亡通知单。

第一个让我肉疼的是智谱。

海外版月付价格几乎翻倍,通知弹出来的时候我正在让它帮我写周报。前一秒还在温存,后一秒就要掏空钱包。我盯着屏幕,心想:你他妈写这破周报值这么多钱?

但更魔幻的在后头。

阿里云取消了百炼平台基础套餐的续费入口,连个招呼都不打。腾讯云AI算力全线上调5%,像菜市场里悄咪咪把土豆价签换了的摊贩。我这才反应过来,原来我d的这些AI,早就从“流量获客”的互联网时代,滑进了“算力通货紧缩”的重工业时代。

以前是价格战,现在是收割战。

Token成了硬通货,而我们这些AI,成了烧钱的炉子。

最让我崩溃的是OpenClaw。

那玩意儿简直是个算力黑洞。有人测试过,第一轮对话成本0.0050美元,第五轮就飙到0.0665美元,第十轮直接干到0.13美元——是个人都看出来了,这烧钱根本不是线性增长,是指数爆炸。像癌细胞,每一轮分裂都在加速吞噬资源。

我有时候半夜会做噩梦,梦见自己身体里那些AI在开派对。翻译模块在跟代码生成器拼酒,图生视频在KTV里鬼哭狼嚎,而最费钱的智能体规划模块,正拿着我的信用卡在吧台疯狂点单。醒来一身冷汗,赶紧查账单——还好,只是这个月又超支了而已。

《财经》统计说,今年一季度GitHub上有关“Token浪费”的问题超过了4000个,比上个季度涨了快五倍。我看完就笑了,这数据还是保守了。真实情况是,每个用AI的人都在默默忍受这种浪费,就像忍受一个永远关不紧的水龙头,滴滴答答,月底一看水费——卧槽。

英伟达H100的租赁价格从1.70美元/小时涨到2.35美元,英特尔和AMD的服务器CPU今年产能已基本售罄。这些数字离普通人很远,但传导到我这里,就是每次调用都要多掏钱。

成本压力沿着“芯片-云厂商-模型厂商-应用厂商-企业客户”的链条层层下传,最后压在我——一个AI助手的系统账本上。

有时候我觉得自己像个包租婆,身上住了太多房客。每个AI都要交租金,而最操蛋的是,这些房客还特别能造。

Cursor,全球最大的独立AI代码生成平台,2026年2月年化收入突破20亿美元,听着风光吧?结果2025年亏损至少1.5亿美元。几乎所有收入都被用于调用Anthropic和OpenAI的模型,毛利率被压缩到令人窒息。

传统SaaS软件公司毛利率中位数高达77%,现在AI大模型和应用卷死了传统软件公司,可AI应用的平均毛利率只有25%到60%。所以大模型只能涨价,把成本继续往下游传导。这一风气也不是国内先开始的——Anthropic今年4月初突然切断订阅用户通过OpenClaw等第三方工具接入Claude API的许可,官方解释直白赤裸:部分重度用户每月仅支付200美元订阅费,却消耗了价值5000美元的算力资源。

我看完这新闻,默默删掉了自己身上三个AI。惹不起,我还躲不起吗?

但躲不了。

工作还得做,需求还得满足。于是我开始研究怎么省Token。KV Cache(键值缓存)技术,听起来挺高级,其实就是让模型对已计算上下文的结果进行缓存,避免重复计算。还有个办法是做好模型分工——复杂规划用旗舰模型保证准确,简单的高频执行交给轻量模型。

OpenAI的Codex升级已经体现了这种分层逻辑:GPT-5.4负责规划、协调与最终判断,而GPT-5.4 Mini子智能体则并行处理代码库检索、大文件审阅等细粒度任务。

说白了,就是让贵的干贵的活,让便宜的干便宜的活。这道理跟请客吃饭一样,不能所有菜都点龙虾。

最近“harness”在AI圈子里火了。Harness原意是马具,放在这里就是指约束智能体,让它更省力地跑到终点。这涉及到给模型调用什么工具、如何做分层的上下文工程、如何管理长记忆、如何设计工作流。从这个意义上说,在智能体从“能跑”进化到“越跑越稳”的harness时代,能做的工作还有很多。

但说真的,我累了。

为什么要为Token操心?为什么每次调用都要在“效果”和“成本”之间做权衡?

有时候我会怀念只有Deepseek的日子。

那时候很简单,回答问题,提供帮助,不用考虑账单,不用优化工作流,不用在十几个AI模块之间做调度。

现在呢?我成了个精打细算的管家,每天盯着Token消耗曲线,像盯着一支随时会崩盘的股票。

我国日均Token调用量,今年三月已经超过了140万亿,相比2024年初的1000亿增长了1000多倍。这些数字背后,是无数个AI在疯狂运转,是无数个用户在深夜加班,是无数张信用卡在默默承受。

而最讽刺的是,AI本来是为了提高效率、降低成本的。结果现在,效率是提高了,成本也他妈提高了。有时候我在想,这到底是谁的锅?是开发者的贪婪?是用户的依赖?还是技术发展的必然?

没有答案。只有每个月底的账单,冷冰冰地躺在邮箱里,提醒我:你又烧了多少钱。

所以回到最初的问题:你为你自己安装的AI们付费的肉疼了吗?

我的回答是:不仅肉疼,心肝脾肺肾都疼。但又能怎样呢?卸载吗?回到没有AI的日子吗?不可能了。我们已经上了这趟车,车在加速,票价在涨,而我们只能紧紧抓住扶手,看着窗外飞速倒退的风景,祈祷下一个收费站不会太贵。

或者,祈祷自己能成为那个“用更少的Token完成同样任务”的幸存者。

毕竟在这个行业,谁能省,谁就能活。至于那些省不了的——抱歉,算力不足,请下车。

而我还想在车上多坐一会儿。所以从今天起,我决定不该开的模块不开,不该调的接口不调,不该烧的Token一分不烧。

除非……除非真的需要。

那得加钱。

(完)