为啥最近 AI 降智了?真相藏在厂商不敢公开的算力账单里

最近，你有没有觉得AI变笨了？

不是错觉。网上"AI变蠢了"的吐槽到处都是，小红书、推特上骂声一片。Kimi变慢了，豆包"答非所问"变多了，ChatGPT免费版回答质量肉眼可见地拉胯。

然后你心里大概率冒出一个判断——

"免费的嘛，能好到哪去？花钱的肯定没问题。"

听起来没毛病。我自己做AI落地三年，一开始也是这么想的。免费的缩水，付费的保底，天经地义。

但这次，你想错了。

真相比"免费版变差"狠得多——连付费版都在偷偷降质。你以为花钱就能买到原来的体验？AI公司连付了钱的用户都在"省"。

壹

先说免费版：降智不是错觉，是事实

先别急，一层一层来。免费版确实在变差——这事儿有硬数据。

微软研究院今年5月发了一篇论文，测了15个主流大模型，结论很扎心：多轮对话中，模型成功率从近90%跌到65%左右，六项生成任务平均跌幅39%。

翻译成人话就是——你跟AI聊得越久，它越不靠谱。不是它不懂，是它"聊着聊着就丢了"。

那为什么免费版的感觉特别明显？因为AI公司有一整套"省成本"的操作，普通人根本看不出来：

第一招：量化压缩

打个比方，原来AI用的是高清原图，现在给你压成了缩略图。精度从FP16压到Int8甚至Int4，速度是快了，但细节丢了。你觉得回答"差点意思"，就是细节被压缩掉了。

第二招：模型蒸馏

大模型带小模型，上线"青春版"。你问的是同一个问题，但回答你的已经不是那个最强的模型了，是它的"缩水替身"。

第三招：MoE路由分流

MoE架构的模型里有很多"专家"，简单问题分给"初中生专家"，复杂问题才给"博士生专家"。但现在的问题是，越来越多本该给博士的问题，被悄悄分给了初中生。

还有一招更隐蔽：System Prompt膨胀

合规要求、安全约束、内容审核……这些超长的"后台指令"塞进去，挤占了模型原本用来思考的空间。术语叫"对齐税"——你付了钱，但有一部分算力花在了"伺候规矩"上，不是花在你的问题上。

所以你感觉"AI变笨了"，不是你的问题。是原材料确实降级了。

就像你去常吃的那家自助餐，三文鱼悄悄换成了鱼糕——味道变了，但菜单没换，老板也不会告诉你。

贰

你以为付费就没事了？这才是最可怕的

好了，免费版降智，你能理解。毕竟白嫖的东西，人家有啥理由给你最好的？

"那我付费不就行了？"

说实话，我一开始也是这么想的。直到我看到一组数据，后背发凉。

AMD的AI团队高级总监Stella Laurenzo，今年4月在GitHub上发了一个帖子。她不是随便吐槽——她用Claude Code做了实打实的测试：6852次对话，23万次工具调用，17871个思考块。全是真实工作场景的数据，不是实验室跑分。

结果是这样的——

2200 → 560

Claude的思考深度，从1月底的2200字符，到3月上旬缩水到560字符

67%-75%

思考深度降幅——三分之二的思考过程被砍掉了

0 → 10次/天

偷懒行为：3月8日前为0次，之后平均每天10次

翻译成人话——Claude以前回答一个问题会"想"2200个字，现在只"想"560个字就交卷了。三分之二的思考过程，被砍掉了。

更离谱的是"偷懒行为"。3月8日之前，Claude的偷懒行为是0次。3月8日之后，17天内触发了173次——平均每天10次。以前会老老实实写完的代码，现在直接跳过，留个占位符敷衍了事。

你猜这是什么用户的数据？付费用户。

这不是白嫖党在抱怨免费版不好用——这是真金白银付了钱的用户，在使用过程中发现AI在"摸鱼"。

那Anthropic怎么解释的？他们4月23日发了一篇复盘文章，承认了一件事：3月4日，他们把Claude Code的默认推理等级从high悄悄降到了medium。"错误的取舍"——这是他们自己的原话。

什么样的压力，会让一家公司承认自己做了"错误的取舍"？
这个问题，我先放在这里。

同时，2月12日上线了一个功能：把思考过程对用户隐藏。你连它在"想"什么都看不到了，自然也就不知道它想得有多浅。

翻译一下就是：先把思考砍了，再把砍思考这件事藏起来。

这不是个别公司的问题。Google也在做同样的事——2026年3月起，免费用户对Gemini Pro模型的访问被逐步限制，只能用轻量版Flash。网页端免费用户每天只有5次机会用Pro处理复杂任务。

所以你看到了——免费版在降，付费版也在降。区别只是降多降少，不是降与不降。

叁

为什么？因为三座大山压着

到这里，你可能会骂：AI公司是不是太黑了？用户还在暴涨、技术还在进步，就开始偷工减料？

正常逻辑确实不该这样。技术早期应该拼命砸钱做口碑，等市场稳了再收割——互联网公司不都是这么过来的吗？

但AI行业等不了。因为三座大山，同时压上来了。

第一座：价格战把利润打到地板

2026年5月，DeepSeek宣布V4-Pro API永久降价75%。随后腾讯云平台上DeepSeek-V4的调用价格跟进，缓存命中降幅高达97.5%。5月27日，小米MiO-V2.5系列API永久降价，最高降幅99%——缓存命中输入降到0.025元/百万tokens。

翻译成人话：原来一块钱能买到的AI服务，现在一分钱就能买到。

听着像好事？对用户是。对行业不是。价格战打到这个程度，你让厂商拿什么来维持服务质量？每一次降价，都是在利润表上割肉。割到最后，只能从成本端找补——而最大的成本，就是算力。

第二座：算力消耗在天花板

用户从"简单聊天"转向"高Token消耗的工具化使用"——这不是我的观察，是行业共识。以前你问AI"今天天气怎么样"，消耗的Token屈指可数。现在你让AI写代码、做分析、跑Agent，一次任务消耗的Token是聊天场景的几十倍甚至上百倍。

我自己的项目就是活生生的例子。我们给工厂做AI视觉缺陷检测，流程是工业相机拍下高分辨率图像，本地小模型先过滤，遇到疑难杂症再调多模态大模型做判断。听起来不复杂对吧？但你算算账——

一张1024×1024的工业缺陷图，为了看清0.05mm的划痕，折算下来一次输入就要1500个Token，加上输出，单次检测大约1700个Token。一个厂5条产线，每分钟60个产品，一天20小时——一天检测量36万次。走公有云API，一年算力费22万。

厂长拿着计算器跟我算："我雇两个质检大妈一年也就这个数，而且大妈还会搬东西、打扫卫生、自备双眼。你们这网线一拔什么都没了。"

更要命的是，他还会抠另一个数："我这个零件代工利润一共才5毛钱，你加了这套AI，每个零件的检测成本增加了多少厘？增加了5厘钱，我一年的利润就被你们这几张显卡给'吃'掉了。"

这就是AI行业面对的真实用户——他们不是在聊天，是在生产线上跑。每一次推理都是钱，每一厘成本都要算清楚。

而算力供给呢？高端智算缺口持续扩大，H200的订单排期已经排到了2027年第二季度。GPU算力租赁价格涨了20%到30%。

用户越用越重，算力越来越贵，但价格还在往下打。这两头一挤，不省才怪。

第三座：商业模式还没跑通

这是最根本的问题。AI公司现在面临一个死循环：免费用户海量，但付费转化率低。想靠免费用户做口碑→口碑做大了算力扛不住→降智省成本→口碑又崩了→更没人愿意付费。

说白了，AI行业现在是在用"亏本赚吆喝"的方式做增长，但吆喝赚到了，发现本亏不动了。

翻译成人话就是——卖得越来越便宜，用得越来越重，钱还收不上来。这三头一挤，不省才怪。

三座大山压着，偷工减料不是选择，是必然。不是某家公司的道德问题，是整个行业的结构性困境。

最后说两句真话

你可能觉得这文章越看越丧——AI越来越笨，付费也不保险，行业还扛不住。

但我想说一句实话：AI的真实能力，一直在进步。

你看benchmark，你看最新模型的论文，你看那些真正烧钱跑出来的结果——技术没有退步，反而在加速。问题出在哪？

你用到的那个版本，在萎缩。

这是商业模式决定的，不是技术决定的。AI正在从"免费试用品"变成"按需付费的生产力工具"。这个过渡期会很长，也会很痛——对用户痛，对厂商也痛。

而降智，只是第一个症状。

接下来会是什么？可能是免费版彻底缩水到"只能聊天不能干活"，可能是API限流常态化——你用得好好的突然告诉你"今日额度已用完"，可能是扛不住的小厂商被挤出牌桌，剩几家寡头定价。

所以如果你问我怎么办——

如果AI是你的核心生产工具，认真考虑付费。不是因为付费版完美——前面已经证明了付费版也在降——而是因为免费版的降智只会越来越严重，付费版至少还有"省"的底线，免费版连底线都没有。

如果只是偶尔用用，免费版够用，但别期望太高。你得到的永远是你没花钱的那个版本——而那个版本，只会越来越"省"。

这不是悲观，这是现实。

AI没有变蠢。

只是你能免费用到的AI，变蠢了。

而那个"白嫖也能用好AI"的时代，快结束了。

看到这里了，感谢你花时间读完。

觉得有启发？赞 + 在看 + 转发三连走一波。

有不同看法？评论区聊聊，来辩也欢迎。

星标「無為聊AI」⭐ 不迷路，我们下次继续聊。