免费AI正在系统性退潮

打开kimi，打出一行字，回车，然后看到一行灰色提示：“高峰时段算力不足，已切换至K2.5快速，升级会员畅用思考模型。”

今年以来，这句话的出镜率高得离谱。高到像条件反射，又像高速公路收费站的栏杆，横在你和那个能深度思考的AI之间。

“已切换至K2.5快速”，不是断掉服务，是降级。“升级会员畅用思考模型”，是有绿色通道，但要给钱。是不是看到了百度网盘的影子？

如果说早期kimi的算力不足还带着初创公司踉跄成长的狼狈，那么今天，在一家手握百亿现金、估值冲向180亿美元的公司身上反复看到这个提示，问题就变得复杂了。

2025年10月，kimi正式上线会员体系，分为免费、49元/月、99元/月三档，将深度研究、OK Computer等核心生产力能力纳入付费权益。2026年初，随着kimi Claw上线，最高档会员定价进一步抬至199元/月。付费墙越筑越高，而免费用户的体验在被系统性地降级。

算力不足，恰好为这场降级提供了最体面的理由。不是不让你用，是现在人多。不想排队？这边有快速通道。

账单到了，得有人付

从2022年ChatGPT横空出世到今天，我们经历了两年多的AI免费午餐。但现在，盘子正在一块一块地被撤走。行业的共识信号已经足够清晰——

免费AI正在系统性退潮。

退潮的根本原因并不复杂，免费模式的钱烧不下去了。

AI大模型的成本结构与传统互联网产品有着根本不同。传统互联网遵循边际成本递减规律，用户越多，单位成本越低，最终形成规模效应。但大模型恰恰相反，推理成本占AI总成本的95%，其中人力只占3%，数据占2%，剩下全是算力。每一次用户交互都要消耗独立的GPU资源，用户越多、调用越频繁，成本就越高，几乎没有边际摊薄效应。

这些成本有多大？一组数据足以说明：OpenAI的推理开销每天约70万美元，即使是成本控制出色的DeepSeek V3，每天也要烧掉约8.7万美元。中国信通院测算显示，电力成本占数据中心运营成本的50%至70%，是算力最大的刚性支出。过去谷歌非AI搜索一次耗电0.3瓦时，电费靠广告就能覆盖；而今天AI一次推理耗电18瓦时，是普通检索的60倍。

成本数字固然触目惊心，但真正让天平倾斜的，是Agent时代的到来。

Agent点燃了算力炸弹

2026年开年，以OpenClaw为代表的AI Agent应用引爆了全球市场。与Chatbot一问一答的线性消耗不同，Agent执行一个任务背后可能触发几十上百次模型调用。规划、拆解、执行、反思、纠错，每一步都要过模型，每一步都在烧算力。

有机构测算，一个稍微复杂一点的Agent任务，其Token消耗动辄放大数十倍，极端场景下甚至是普通对话的百倍、千倍。

小米AI负责人、前DeepSeek核心成员罗福莉就说，全球算力供给已经跟不上Agent创造的Token需求增速，订阅价格和真实算力成本的差距“不是缺口，而是天坑”。

国金证券研报也指出，算力供需正在发出关键信号，需求端以指数级膨胀，供给端却受限于芯片管制与成本约束，难以同步扩张。

免费模式在Chatbot时代已经捉襟见肘，在Agent时代则是彻底崩盘。

没人能置身事外

面对这样的成本压力，头部公司的动作出奇地一致。

OpenAI打响了最引人注目的第一枪。2026年2月，OpenAI在ChatGPT免费版和8美元月费的Go版中正式上线广告，采用CPM模式向广告主招商。曾经称广告为“最后手段”的Sam Altman，最终在高昂的算力账单面前妥协了。ChatGPT的广告业务上线数周收入即突破1亿美元，OpenAI预计2026年全年广告收入将达到25亿美元，2030年冲击1000亿美元。与此同时，OpenAI还在推动免费用户向低价订阅转化，因为其活跃用户中付费比例仅约5%，95%的免费用户是巨大的待挖掘矿藏。

中国的调整来得更密集。腾讯云今年3月13日起结束GLM 5、MiniMax 2.5、Kimi 2.5三款模型的免费公测，转为正式商用按量计费，同时将混元系列模型价格上调超过5倍。4月9日，腾讯云再度宣布AI算力相关产品整体涨价5%。智谱则在2026年一季度内连续三次提价，API定价累计上调超过80%，但调用量不降反增400%。

智谱CEO张鹏解释说，“调整价格是为了回归正常的商业价值，长期低价竞争不利于行业发展。”

即便是曾经以免费为信仰的DeepSeek也守不住了。4月8日上线的“快速模式”和“专家模式”分层界面，被业内普遍解读为商业化前奏。“专家模式”入口上出现了常被用于指代付费内容的“钻石”标识。此前DeepSeek一直坚持全免费、无门槛的策略，被贴上“技术理想主义”的标签，但随着模型参数越来越大，高推理成本让全免费、无分层的模式难以为继。

Kimi同样在这一轮中加速商业化。1月26日更新的会员权益规定，免费用户每月仅能获得1次深度研究、3次PPT等有限使用次数，核心生产力功能被划入付费墙。效果立竿见影。Kimi K2.5模型上线一个月后，月之暗面的年度经常性收入（ARR）突破1亿美元。与此同时，其估值在3个月内翻了4倍，达到180亿美元。

两条路：广告还是付费？

退潮之后，行业走出了两条截然不同的路。

一条是OpenAI的路：广告。将免费用户的注意力转化为广告收入，用“免费+广告”的互联网经典配方支撑算力成本。这条路效率高、见效快，但代价是AI回答的中立性可能被侵蚀。当AI的回答里开始嵌入广告时，它到底是在为你思考，还是在为广告主思考？

另一条是Anthropic的路：拒绝广告，坚持纯订阅。OpenAI宣布广告计划仅一天后，Anthropic就明确表态，“Claude将保持无广告。我们的用户不会在对话中看到‘赞助’链接，Claude的回答也不会受广告主影响。”但这条路需要更高的付费转化率和更强的用户粘性来支撑。

两条路没有绝对的对错。广告追求规模化变现，无广告追求信任溢价。行业的分化才刚刚开始。

哑铃型商业范式的形成

无论走哪条路，一个共同的趋势是，免费模型满足轻量需求，付费解锁高速、长文本和专业能力。免费AI不会完全消失，但它会退化为有限免费，变成一个获客入口、一个试用样本、一个让你尝到甜头然后付费的钩子。

有分析说，C端真实请求中约80%可以用低成本“快速模式”覆盖，剩下20%的复杂请求才需要调用高参数“专家模式”。分层机制既实现了算力分层调度，也完成了用户价值的筛选。上银基金认为，产品分层是算力供给约束下的理性调整，“全免费、无分层”逐渐成为一种不可持续的模式。

行业研究机构SSIR预测，2025到2026年初，免费和低成本AI工具仍然广泛可用，但高级功能开始向付费层级集中；2026年底到2027年，免费层级将变得更慢、更受限，高上下文、隐私保护和领域专用模型将全面进入付费墙。

免费AI正在退潮，但退的不是“AI”，而是“免费”。对用户而言，这意味着一个习惯了两年的时代正在结束。该习惯为生产力付费，该习惯AI不是空气和水。这未必是坏事，因为一个可持续的商业模式，才能支撑起真正可持续的技术进步。

只是，习惯了免费的我们，需要一点时间来接受这个事实。