一、一个结构性问题
一个结构性问题:AI正在进入"第二幕危机"。
第一幕是"看它能做什么"——一个模型可以写诗、写代码、画画,所有人都在惊叹技术的力量。这个阶段持续了大概两年(2023-2025)。
第二幕是"看它能不能养活自己"——当技术进入社会系统,开始暴露它自身的结构性矛盾。我称这些矛盾为"AI的自噬悖论":AI的成功正在侵蚀它自身赖以生存的基础。
二、四种悖论
悖论一:数据自噬——AI的成功正在杀死自己的食物来源
Stack Overflow的死亡螺旋,不是一个孤立事件——它是"AI自噬"的典型症状。
2026年5月,Stack Overflow月新提问量已降至6866条,接近2008年水平。开发者不再去社区提问——他们直接问AI了。
但讽刺的是:AI之所以能回答问题,恰恰是因为它用Stack Overflow过去16年积累的1.15亿条问答数据训练过。社区创造了数据 → 数据训练了AI → AI取代了社区 → 社区不再产生新数据。
这是一个闭环自噬:AI吃掉自己的食物来源,然后饿死。
这不是一个公司的悲剧,这是一个系统性问题。Nature发表的研究已从理论上证明了"模型崩溃"(Model Collapse)的存在:当AI模型递归地使用前代AI生成的数据训练自己时,每一代都会丢失低概率事件的建模能力,输出多样性逐代下降,误差累积放大,最终收敛到一个毫无价值的点估计。
论文的结论很直白:在AI生成的数据上训练AI,是通往AI"痴呆"的捷径。
今天,互联网上已经有大量AI生成的内容。当下一批模型用这批"被污染"的数据训练时,它们已经在吃自己的"屎"了。
这不是一个未来的问题,这是一个正在进行的过程。
悖论二:效率幻觉——AI让你"感觉"高效,但在系统层面正在贬值
MIT等多校联合研究的发现很扎心:人们使用AI时主观感觉效率提升了55.7秒,但实际只节省了7.5秒。差距接近7倍。
这看起来只是"人的感觉不靠谱"——但如果把它放在更大的图景里看,你会发现一个更严重的问题。
McKinsey 2026年4月的研究报告用数据证明了同一个现象正在企业层面重演:尽管企业对AI的投入超过5000亿美元,宏观生产力指标并没有出现对应的增长。95%的企业在增加AI支出,但大部分企业在"创造价值"上停滞不前。
为什么?
因为AI的"效率"是一种局部效率——它在单个任务层面确实更快(省了7.5秒),但在系统层面,它带来了新的成本:
过度调用成本:因为觉得AI很快,所以什么事都让AI做。那些自己动手10秒钟就能完成的任务,你也要叫AI,然后觉得自己"省了好多时间"。 审查成本:AI生成的内容需要人工审查和校对。如果未加控制,AI生成的内容会淹没人类判断和审查的能力——Seramount的研究指出,这实际上是在破坏生产力。 技能退化成本:人们不再练习基本功,因为"反正AI会帮我做"。科学研究已经证实:过度依赖AI会导致人类核心技能的系统性退化(ScienceDirect 2026年5月发表的跨领域综述论文《AI-overdependence and human cognitive decline》)。
这就是"效率悖论"的核心:局部效率的提升,被系统效率的下降抵消了。
回到企业层面:为什么95%的企业用AI砸钱但看不到回报?因为AI最擅长的是自动化(省成本),而不是创新(创价值)。省成本是可测量、可执行的;创价值是模糊、高风险、需要定义的。
于是所有人都选择了"降本"——裁员。但一家公司不能通过无限裁员来无限增长。
悖论三:评价真空——我们没有能力诚实评价AI的好坏
AI视频的评价困境很有意思。无论AI输出什么——模糊的、静止的、抖动的——总有一套万能话术可以包装它:"高动态表现力"、"文戏牛逼"、"沉浸感强"。
这看起来只是一个行业内的吹水现象,但它揭示了一个更深层的问题:我们还没有建立起诚实评价AI内容的语言体系。
原因不难理解:
评价者缺乏参照系——AI生成的内容在不断变化,你无法用"这是否像人类作品"作为标准,因为AI在快速逼近人类。 评价者面临利益冲突——谁愿意说"这个AI很烂"?说这话的人会被认为"不懂趋势"。 缺乏客观工具——没有类似代码测试那样的自动化评估框架来评价视频质量。"好"和"不好"变成了纯粹的主观判断。
于是整个生态陷入了**"皇帝的新衣"困境**:每个人都能隐约感觉到质量有问题,但没人愿意打破共识。
这和模型崩溃有直接关系。 当AI生成的视频和文字充斥着互联网,并被用于训练下一代模型时,我们的评价体系失灵会加速整个系统的退化——因为分不清好坏,所以好坏一起被当成"好"数据喂给下一批模型。
悖论四:代理债的隐喻——我们正在用搭积木的方式盖摩天大楼
"代理债"(Agent Debt)这个概念浮出水面不是偶然。
它描述的现象很具体:快速搭建的AI Agent,由于缺乏维护,系统提示(prompt)冲突、记忆污染、工具重叠等问题层层叠加,最终Agent行为异常且难以修复。
但它是一个更大的问题的隐喻:整个AI行业正在用搭积木的方式盖摩天大楼。
系统提示层层叠加 → 像是给算法打补丁 记忆污染无法追溯 → 像是没有版本控制的代码库 工具调用互相干扰 → 像是没有API契约的微服务
我们享受了快速搭建带来的红利,但维护成本正在以指数级增长。
这和"代码重构"的逻辑如出一辙。你借了技术债,你总得还。但代理债比技术债更难还——因为技术债至少写在代码里,你还能重构;代理债写在prompt里、藏在上万次对话的历史中、散落在互相覆盖的记忆模块里——你连"欠了多少"都不知道。
三、教皇为什么急了?——悖论的顶点
教皇Leo十四世在2026年5月发布的通谕《Magnifica Humanitas》呼吁"解除AI武装",主张将AI从科技寡头的垄断控制中解放,关注数据标注员的数字劳工问题。
很多人不理解:教皇管AI干嘛?
但如果你把前面的三个悖论串在一起,教皇的焦虑就变得非常合理了。
串一下:
数据自噬 → AI越来越依赖人类产生的数据,但谁在产生这些数据?不是你我——是那些每天标注几万张图片、月收入不到200美元的数据标注员。教皇称之为"新的数字奴隶制"。 效率幻觉 → 企业花了5000亿美元在AI上但看不到回报 → 于是裁员 → 被裁的人和数据标注员之间的差距越来越大。 评价真空 → 我们无法诚实评价AI → 科技公司可以无限地"画饼" → 公共讨论被技术乐观主义裹挟 → 没有人去问那些被遗忘的人的问题。
当这四个悖论叠加在一起,你会看到一幅完整的画面:AI正在把权力和财富向极少数人集中,而把成本和风险转嫁给最边缘的群体。
教皇看到的不是"技术是否进步",而是"进步的成本由谁承担"。他给出的答案是:AI需要被"解除武装"——从竞争和垄断的逻辑中解放出来。
这听起来很理想主义。但物理学的事实是:一个正在缩小的资源池,必然会导致更激烈的争夺。 当纯净的人类数据变得越来越稀缺、当AI的边际收益递减、当评价体系失灵——那个"被争夺"的东西,就是权力。
四、从"看它能做什么"到"看它能不能养活自己"
我之所以称为"AI的第二幕危机",是因为它们共同指向一个事实:
AI正在从"技术问题"变成"生态系统问题"。
第一幕的问题是:"这个模型能做哪些令人惊叹的事情?"
第二幕的问题是:
它的食物(人类数据)够不够吃? 它的效率提升是真的还是幻觉? 我们有没有能力诚实评价它的好坏? 当它出了问题,我们能不能修? 它创造的价值,是被分享了还是被垄断了? 当它"吃掉"了自己生长的土壤,它会怎么办?
这些问题没有一个可以通过"更强的模型"来回答。
更强的模型需要更多的数据——但数据正在枯竭。 更强的模型感觉上更快——但系统效率在下降。 更强的模型生成的内容更难评价——但评价体系是真空。 更强的模型系统更复杂——但维护能力没有跟上。 更强的模型消耗更多算力——但成本在集中,收益在分化。
这就是为什么我说"第二幕"比"第一幕"难得多。 第一幕只需要技术突破。第二幕需要社会创新。
那怎么办?基于以上的分析,我有三条非共识的判断:
判断一:未来十年最稀缺的资源不是算力,不是模型能力——而是经过验证的、人类生成的、结构化的数据。 谁掌握了这个资源的持续供给,谁就能打破"模型崩溃"的诅咒。这意味着数据溯源、数据治理、数据经济会成为比模型训练更重要的赛道。
判断二:AI行业的赢家不会是模型最强的公司,而是"评价体系"最完善的公司。 在"皇帝的新衣"里,最终获利的不是裁缝(AI公司),而是那个说实话的小孩。谁能建立可信的AI质量评价标准,谁就拥有了行业话语权。
判断三:代理人(Agent)的瓶颈不是智能,不是推理——而是可维护性。 正如软件工程的突破不是"能写出更长的代码",而是"能维护更复杂的系统"(版本控制、CI/CD、代码审查、重构方法论),AI Agent的突破也不会是"更聪明",而是"更容易维护"。谁解决了"代理债"的问题,谁就真正解锁了Agent时代。
夜雨聆风