
打开kimi,打出一行字,回车,然后看到一行灰色提示:“高峰时段算力不足,已切换至K2.5快速,升级会员畅用思考模型。”
今年以来,这句话的出镜率高得离谱。高到像条件反射,又像高速公路收费站的栏杆,横在你和那个能深度思考的AI之间。
“已切换至K2.5快速”,不是断掉服务,是降级。“升级会员畅用思考模型”,是有绿色通道,但要给钱。是不是看到了百度网盘的影子?
如果说早期kimi的算力不足还带着初创公司踉跄成长的狼狈,那么今天,在一家手握百亿现金、估值冲向180亿美元的公司身上反复看到这个提示,问题就变得复杂了。
2025年10月,kimi正式上线会员体系,分为免费、49元/月、99元/月三档,将深度研究、OK Computer等核心生产力能力纳入付费权益。2026年初,随着kimi Claw上线,最高档会员定价进一步抬至199元/月。付费墙越筑越高,而免费用户的体验在被系统性地降级。
算力不足,恰好为这场降级提供了最体面的理由。不是不让你用,是现在人多。不想排队?这边有快速通道。
账单到了,得有人付
从2022年ChatGPT横空出世到今天,我们经历了两年多的AI免费午餐。但现在,盘子正在一块一块地被撤走。行业的共识信号已经足够清晰——
免费AI正在系统性退潮。
退潮的根本原因并不复杂,免费模式的钱烧不下去了。
AI大模型的成本结构与传统互联网产品有着根本不同。传统互联网遵循边际成本递减规律,用户越多,单位成本越低,最终形成规模效应。但大模型恰恰相反,推理成本占AI总成本的95%,其中人力只占3%,数据占2%,剩下全是算力。每一次用户交互都要消耗独立的GPU资源,用户越多、调用越频繁,成本就越高,几乎没有边际摊薄效应。
这些成本有多大?一组数据足以说明:OpenAI的推理开销每天约70万美元,即使是成本控制出色的DeepSeek V3,每天也要烧掉约8.7万美元。中国信通院测算显示,电力成本占数据中心运营成本的50%至70%,是算力最大的刚性支出。过去谷歌非AI搜索一次耗电0.3瓦时,电费靠广告就能覆盖;而今天AI一次推理耗电18瓦时,是普通检索的60倍。
成本数字固然触目惊心,但真正让天平倾斜的,是Agent时代的到来。
Agent点燃了算力炸弹
2026年开年,以OpenClaw为代表的AI Agent应用引爆了全球市场。与Chatbot一问一答的线性消耗不同,Agent执行一个任务背后可能触发几十上百次模型调用。规划、拆解、执行、反思、纠错,每一步都要过模型,每一步都在烧算力。
有机构测算,一个稍微复杂一点的Agent任务,其Token消耗动辄放大数十倍,极端场景下甚至是普通对话的百倍、千倍。
小米AI负责人、前DeepSeek核心成员罗福莉就说,全球算力供给已经跟不上Agent创造的Token需求增速,订阅价格和真实算力成本的差距“不是缺口,而是天坑”。
国金证券研报也指出,算力供需正在发出关键信号,需求端以指数级膨胀,供给端却受限于芯片管制与成本约束,难以同步扩张。
免费模式在Chatbot时代已经捉襟见肘,在Agent时代则是彻底崩盘。
没人能置身事外
面对这样的成本压力,头部公司的动作出奇地一致。
OpenAI打响了最引人注目的第一枪。2026年2月,OpenAI在ChatGPT免费版和8美元月费的Go版中正式上线广告,采用CPM模式向广告主招商。曾经称广告为“最后手段”的Sam Altman,最终在高昂的算力账单面前妥协了。ChatGPT的广告业务上线数周收入即突破1亿美元,OpenAI预计2026年全年广告收入将达到25亿美元,2030年冲击1000亿美元。与此同时,OpenAI还在推动免费用户向低价订阅转化,因为其活跃用户中付费比例仅约5%,95%的免费用户是巨大的待挖掘矿藏。
中国的调整来得更密集。腾讯云今年3月13日起结束GLM 5、MiniMax 2.5、Kimi 2.5三款模型的免费公测,转为正式商用按量计费,同时将混元系列模型价格上调超过5倍。4月9日,腾讯云再度宣布AI算力相关产品整体涨价5%。智谱则在2026年一季度内连续三次提价,API定价累计上调超过80%,但调用量不降反增400%。
智谱CEO张鹏解释说,“调整价格是为了回归正常的商业价值,长期低价竞争不利于行业发展。”
即便是曾经以免费为信仰的DeepSeek也守不住了。4月8日上线的“快速模式”和“专家模式”分层界面,被业内普遍解读为商业化前奏。“专家模式”入口上出现了常被用于指代付费内容的“钻石”标识。此前DeepSeek一直坚持全免费、无门槛的策略,被贴上“技术理想主义”的标签,但随着模型参数越来越大,高推理成本让全免费、无分层的模式难以为继。
Kimi同样在这一轮中加速商业化。1月26日更新的会员权益规定,免费用户每月仅能获得1次深度研究、3次PPT等有限使用次数,核心生产力功能被划入付费墙。效果立竿见影。Kimi K2.5模型上线一个月后,月之暗面的年度经常性收入(ARR)突破1亿美元。与此同时,其估值在3个月内翻了4倍,达到180亿美元。
两条路:广告还是付费?
退潮之后,行业走出了两条截然不同的路。
一条是OpenAI的路:广告。将免费用户的注意力转化为广告收入,用“免费+广告”的互联网经典配方支撑算力成本。这条路效率高、见效快,但代价是AI回答的中立性可能被侵蚀。当AI的回答里开始嵌入广告时,它到底是在为你思考,还是在为广告主思考?
另一条是Anthropic的路:拒绝广告,坚持纯订阅。OpenAI宣布广告计划仅一天后,Anthropic就明确表态,“Claude将保持无广告。我们的用户不会在对话中看到‘赞助’链接,Claude的回答也不会受广告主影响。”但这条路需要更高的付费转化率和更强的用户粘性来支撑。
两条路没有绝对的对错。广告追求规模化变现,无广告追求信任溢价。行业的分化才刚刚开始。
哑铃型商业范式的形成
无论走哪条路,一个共同的趋势是,免费模型满足轻量需求,付费解锁高速、长文本和专业能力。免费AI不会完全消失,但它会退化为有限免费,变成一个获客入口、一个试用样本、一个让你尝到甜头然后付费的钩子。
有分析说,C端真实请求中约80%可以用低成本“快速模式”覆盖,剩下20%的复杂请求才需要调用高参数“专家模式”。分层机制既实现了算力分层调度,也完成了用户价值的筛选。上银基金认为,产品分层是算力供给约束下的理性调整,“全免费、无分层”逐渐成为一种不可持续的模式。
行业研究机构SSIR预测,2025到2026年初,免费和低成本AI工具仍然广泛可用,但高级功能开始向付费层级集中;2026年底到2027年,免费层级将变得更慢、更受限,高上下文、隐私保护和领域专用模型将全面进入付费墙。
免费AI正在退潮,但退的不是“AI”,而是“免费”。对用户而言,这意味着一个习惯了两年的时代正在结束。该习惯为生产力付费,该习惯AI不是空气和水。这未必是坏事,因为一个可持续的商业模式,才能支撑起真正可持续的技术进步。
只是,习惯了免费的我们,需要一点时间来接受这个事实。
夜雨聆风