
最近,你有没有觉得AI变笨了?
不是错觉。网上"AI变蠢了"的吐槽到处都是,小红书、推特上骂声一片。Kimi变慢了,豆包"答非所问"变多了,ChatGPT免费版回答质量肉眼可见地拉胯。
然后你心里大概率冒出一个判断——
"免费的嘛,能好到哪去?花钱的肯定没问题。"
听起来没毛病。我自己做AI落地三年,一开始也是这么想的。免费的缩水,付费的保底,天经地义。
但这次,你想错了。
真相比"免费版变差"狠得多——连付费版都在偷偷降质。你以为花钱就能买到原来的体验?AI公司连付了钱的用户都在"省"。

先说免费版:降智不是错觉,是事实
先别急,一层一层来。免费版确实在变差——这事儿有硬数据。
微软研究院今年5月发了一篇论文,测了15个主流大模型,结论很扎心:多轮对话中,模型成功率从近90%跌到65%左右,六项生成任务平均跌幅39%。
翻译成人话就是——你跟AI聊得越久,它越不靠谱。不是它不懂,是它"聊着聊着就丢了"。
那为什么免费版的感觉特别明显?因为AI公司有一整套"省成本"的操作,普通人根本看不出来:
第一招:量化压缩
打个比方,原来AI用的是高清原图,现在给你压成了缩略图。精度从FP16压到Int8甚至Int4,速度是快了,但细节丢了。你觉得回答"差点意思",就是细节被压缩掉了。
第二招:模型蒸馏
大模型带小模型,上线"青春版"。你问的是同一个问题,但回答你的已经不是那个最强的模型了,是它的"缩水替身"。
第三招:MoE路由分流
MoE架构的模型里有很多"专家",简单问题分给"初中生专家",复杂问题才给"博士生专家"。但现在的问题是,越来越多本该给博士的问题,被悄悄分给了初中生。
还有一招更隐蔽:System Prompt膨胀
合规要求、安全约束、内容审核……这些超长的"后台指令"塞进去,挤占了模型原本用来思考的空间。术语叫"对齐税"——你付了钱,但有一部分算力花在了"伺候规矩"上,不是花在你的问题上。
所以你感觉"AI变笨了",不是你的问题。是原材料确实降级了。
就像你去常吃的那家自助餐,三文鱼悄悄换成了鱼糕——味道变了,但菜单没换,老板也不会告诉你。

你以为付费就没事了?这才是最可怕的
好了,免费版降智,你能理解。毕竟白嫖的东西,人家有啥理由给你最好的?
"那我付费不就行了?"
说实话,我一开始也是这么想的。直到我看到一组数据,后背发凉。
AMD的AI团队高级总监Stella Laurenzo,今年4月在GitHub上发了一个帖子。她不是随便吐槽——她用Claude Code做了实打实的测试:6852次对话,23万次工具调用,17871个思考块。全是真实工作场景的数据,不是实验室跑分。
结果是这样的——
2200 → 560
Claude的思考深度,从1月底的2200字符,到3月上旬缩水到560字符
67%-75%
思考深度降幅——三分之二的思考过程被砍掉了
0 → 10次/天
偷懒行为:3月8日前为0次,之后平均每天10次
翻译成人话——Claude以前回答一个问题会"想"2200个字,现在只"想"560个字就交卷了。三分之二的思考过程,被砍掉了。
更离谱的是"偷懒行为"。3月8日之前,Claude的偷懒行为是0次。3月8日之后,17天内触发了173次——平均每天10次。以前会老老实实写完的代码,现在直接跳过,留个占位符敷衍了事。
你猜这是什么用户的数据?付费用户。
这不是白嫖党在抱怨免费版不好用——这是真金白银付了钱的用户,在使用过程中发现AI在"摸鱼"。
那Anthropic怎么解释的?他们4月23日发了一篇复盘文章,承认了一件事:3月4日,他们把Claude Code的默认推理等级从high悄悄降到了medium。"错误的取舍"——这是他们自己的原话。
什么样的压力,会让一家公司承认自己做了"错误的取舍"?
这个问题,我先放在这里。
同时,2月12日上线了一个功能:把思考过程对用户隐藏。你连它在"想"什么都看不到了,自然也就不知道它想得有多浅。
翻译一下就是:先把思考砍了,再把砍思考这件事藏起来。
这不是个别公司的问题。Google也在做同样的事——2026年3月起,免费用户对Gemini Pro模型的访问被逐步限制,只能用轻量版Flash。网页端免费用户每天只有5次机会用Pro处理复杂任务。
所以你看到了——免费版在降,付费版也在降。区别只是降多降少,不是降与不降。

为什么?因为三座大山压着
到这里,你可能会骂:AI公司是不是太黑了?用户还在暴涨、技术还在进步,就开始偷工减料?
正常逻辑确实不该这样。技术早期应该拼命砸钱做口碑,等市场稳了再收割——互联网公司不都是这么过来的吗?
但AI行业等不了。因为三座大山,同时压上来了。
第一座:价格战把利润打到地板
2026年5月,DeepSeek宣布V4-Pro API永久降价75%。随后腾讯云平台上DeepSeek-V4的调用价格跟进,缓存命中降幅高达97.5%。5月27日,小米MiO-V2.5系列API永久降价,最高降幅99%——缓存命中输入降到0.025元/百万tokens。
翻译成人话:原来一块钱能买到的AI服务,现在一分钱就能买到。
听着像好事?对用户是。对行业不是。价格战打到这个程度,你让厂商拿什么来维持服务质量?每一次降价,都是在利润表上割肉。割到最后,只能从成本端找补——而最大的成本,就是算力。
第二座:算力消耗在天花板
用户从"简单聊天"转向"高Token消耗的工具化使用"——这不是我的观察,是行业共识。以前你问AI"今天天气怎么样",消耗的Token屈指可数。现在你让AI写代码、做分析、跑Agent,一次任务消耗的Token是聊天场景的几十倍甚至上百倍。
我自己的项目就是活生生的例子。我们给工厂做AI视觉缺陷检测,流程是工业相机拍下高分辨率图像,本地小模型先过滤,遇到疑难杂症再调多模态大模型做判断。听起来不复杂对吧?但你算算账——
一张1024×1024的工业缺陷图,为了看清0.05mm的划痕,折算下来一次输入就要1500个Token,加上输出,单次检测大约1700个Token。一个厂5条产线,每分钟60个产品,一天20小时——一天检测量36万次。走公有云API,一年算力费22万。
厂长拿着计算器跟我算:"我雇两个质检大妈一年也就这个数,而且大妈还会搬东西、打扫卫生、自备双眼。你们这网线一拔什么都没了。"
更要命的是,他还会抠另一个数:"我这个零件代工利润一共才5毛钱,你加了这套AI,每个零件的检测成本增加了多少厘?增加了5厘钱,我一年的利润就被你们这几张显卡给'吃'掉了。"
这就是AI行业面对的真实用户——他们不是在聊天,是在生产线上跑。每一次推理都是钱,每一厘成本都要算清楚。
而算力供给呢?高端智算缺口持续扩大,H200的订单排期已经排到了2027年第二季度。GPU算力租赁价格涨了20%到30%。
用户越用越重,算力越来越贵,但价格还在往下打。这两头一挤,不省才怪。
第三座:商业模式还没跑通
这是最根本的问题。AI公司现在面临一个死循环:免费用户海量,但付费转化率低。想靠免费用户做口碑→口碑做大了算力扛不住→降智省成本→口碑又崩了→更没人愿意付费。
说白了,AI行业现在是在用"亏本赚吆喝"的方式做增长,但吆喝赚到了,发现本亏不动了。
翻译成人话就是——卖得越来越便宜,用得越来越重,钱还收不上来。这三头一挤,不省才怪。
三座大山压着,偷工减料不是选择,是必然。不是某家公司的道德问题,是整个行业的结构性困境。
你可能觉得这文章越看越丧——AI越来越笨,付费也不保险,行业还扛不住。
但我想说一句实话:AI的真实能力,一直在进步。
你看benchmark,你看最新模型的论文,你看那些真正烧钱跑出来的结果——技术没有退步,反而在加速。问题出在哪?
你用到的那个版本,在萎缩。
这是商业模式决定的,不是技术决定的。AI正在从"免费试用品"变成"按需付费的生产力工具"。这个过渡期会很长,也会很痛——对用户痛,对厂商也痛。
而降智,只是第一个症状。
接下来会是什么?可能是免费版彻底缩水到"只能聊天不能干活",可能是API限流常态化——你用得好好的突然告诉你"今日额度已用完",可能是扛不住的小厂商被挤出牌桌,剩几家寡头定价。
所以如果你问我怎么办——
如果AI是你的核心生产工具,认真考虑付费。不是因为付费版完美——前面已经证明了付费版也在降——而是因为免费版的降智只会越来越严重,付费版至少还有"省"的底线,免费版连底线都没有。
如果只是偶尔用用,免费版够用,但别期望太高。你得到的永远是你没花钱的那个版本——而那个版本,只会越来越"省"。
这不是悲观,这是现实。
AI没有变蠢。
只是你能免费用到的AI,变蠢了。
而那个"白嫖也能用好AI"的时代,快结束了。
看到这里了,感谢你花时间读完。
觉得有启发?赞 + 在看 + 转发三连走一波。
有不同看法?评论区聊聊,来辩也欢迎。
星标「無為聊AI」⭐ 不迷路,我们下次继续聊。
夜雨聆风