AI的第二幕危机:当技术开始吞噬自己生长的土壤

一、一个结构性问题

一个结构性问题：AI正在进入"第二幕危机"。

第一幕是"看它能做什么"——一个模型可以写诗、写代码、画画，所有人都在惊叹技术的力量。这个阶段持续了大概两年（2023-2025）。

第二幕是"看它能不能养活自己"——当技术进入社会系统，开始暴露它自身的结构性矛盾。我称这些矛盾为"AI的自噬悖论"：AI的成功正在侵蚀它自身赖以生存的基础。

二、四种悖论

悖论一：数据自噬——AI的成功正在杀死自己的食物来源

Stack Overflow的死亡螺旋，不是一个孤立事件——它是"AI自噬"的典型症状。

2026年5月，Stack Overflow月新提问量已降至6866条，接近2008年水平。开发者不再去社区提问——他们直接问AI了。

但讽刺的是：AI之所以能回答问题，恰恰是因为它用Stack Overflow过去16年积累的1.15亿条问答数据训练过。社区创造了数据 → 数据训练了AI → AI取代了社区 → 社区不再产生新数据。

这是一个闭环自噬：AI吃掉自己的食物来源，然后饿死。

这不是一个公司的悲剧，这是一个系统性问题。Nature发表的研究已从理论上证明了"模型崩溃"（Model Collapse）的存在：当AI模型递归地使用前代AI生成的数据训练自己时，每一代都会丢失低概率事件的建模能力，输出多样性逐代下降，误差累积放大，最终收敛到一个毫无价值的点估计。

论文的结论很直白：在AI生成的数据上训练AI，是通往AI"痴呆"的捷径。

今天，互联网上已经有大量AI生成的内容。当下一批模型用这批"被污染"的数据训练时，它们已经在吃自己的"屎"了。

这不是一个未来的问题，这是一个正在进行的过程。

悖论二：效率幻觉——AI让你"感觉"高效，但在系统层面正在贬值

MIT等多校联合研究的发现很扎心：人们使用AI时主观感觉效率提升了55.7秒，但实际只节省了7.5秒。差距接近7倍。

这看起来只是"人的感觉不靠谱"——但如果把它放在更大的图景里看，你会发现一个更严重的问题。

McKinsey 2026年4月的研究报告用数据证明了同一个现象正在企业层面重演：尽管企业对AI的投入超过5000亿美元，宏观生产力指标并没有出现对应的增长。95%的企业在增加AI支出，但大部分企业在"创造价值"上停滞不前。

为什么？

因为AI的"效率"是一种局部效率——它在单个任务层面确实更快（省了7.5秒），但在系统层面，它带来了新的成本：

过度调用成本：因为觉得AI很快，所以什么事都让AI做。那些自己动手10秒钟就能完成的任务，你也要叫AI，然后觉得自己"省了好多时间"。
审查成本：AI生成的内容需要人工审查和校对。如果未加控制，AI生成的内容会淹没人类判断和审查的能力——Seramount的研究指出，这实际上是在破坏生产力。
技能退化成本：人们不再练习基本功，因为"反正AI会帮我做"。科学研究已经证实：过度依赖AI会导致人类核心技能的系统性退化（ScienceDirect 2026年5月发表的跨领域综述论文《AI-overdependence and human cognitive decline》）。

这就是"效率悖论"的核心：局部效率的提升，被系统效率的下降抵消了。

回到企业层面：为什么95%的企业用AI砸钱但看不到回报？因为AI最擅长的是自动化（省成本），而不是创新（创价值）。省成本是可测量、可执行的；创价值是模糊、高风险、需要定义的。

于是所有人都选择了"降本"——裁员。但一家公司不能通过无限裁员来无限增长。

悖论三：评价真空——我们没有能力诚实评价AI的好坏

AI视频的评价困境很有意思。无论AI输出什么——模糊的、静止的、抖动的——总有一套万能话术可以包装它："高动态表现力"、"文戏牛逼"、"沉浸感强"。

这看起来只是一个行业内的吹水现象，但它揭示了一个更深层的问题：我们还没有建立起诚实评价AI内容的语言体系。

原因不难理解：

评价者缺乏参照系——AI生成的内容在不断变化，你无法用"这是否像人类作品"作为标准，因为AI在快速逼近人类。
评价者面临利益冲突——谁愿意说"这个AI很烂"？说这话的人会被认为"不懂趋势"。
缺乏客观工具——没有类似代码测试那样的自动化评估框架来评价视频质量。"好"和"不好"变成了纯粹的主观判断。

于是整个生态陷入了**"皇帝的新衣"困境**：每个人都能隐约感觉到质量有问题，但没人愿意打破共识。

这和模型崩溃有直接关系。 当AI生成的视频和文字充斥着互联网，并被用于训练下一代模型时，我们的评价体系失灵会加速整个系统的退化——因为分不清好坏，所以好坏一起被当成"好"数据喂给下一批模型。

悖论四：代理债的隐喻——我们正在用搭积木的方式盖摩天大楼

"代理债"（Agent Debt）这个概念浮出水面不是偶然。

它描述的现象很具体：快速搭建的AI Agent，由于缺乏维护，系统提示（prompt）冲突、记忆污染、工具重叠等问题层层叠加，最终Agent行为异常且难以修复。

但它是一个更大的问题的隐喻：整个AI行业正在用搭积木的方式盖摩天大楼。

系统提示层层叠加 → 像是给算法打补丁
记忆污染无法追溯 → 像是没有版本控制的代码库
工具调用互相干扰 → 像是没有API契约的微服务

我们享受了快速搭建带来的红利，但维护成本正在以指数级增长。

这和"代码重构"的逻辑如出一辙。你借了技术债，你总得还。但代理债比技术债更难还——因为技术债至少写在代码里，你还能重构；代理债写在prompt里、藏在上万次对话的历史中、散落在互相覆盖的记忆模块里——你连"欠了多少"都不知道。

三、教皇为什么急了？——悖论的顶点

教皇Leo十四世在2026年5月发布的通谕《Magnifica Humanitas》呼吁"解除AI武装"，主张将AI从科技寡头的垄断控制中解放，关注数据标注员的数字劳工问题。

很多人不理解：教皇管AI干嘛？

但如果你把前面的三个悖论串在一起，教皇的焦虑就变得非常合理了。

串一下：

数据自噬 → AI越来越依赖人类产生的数据，但谁在产生这些数据？不是你我——是那些每天标注几万张图片、月收入不到200美元的数据标注员。教皇称之为"新的数字奴隶制"。
效率幻觉 → 企业花了5000亿美元在AI上但看不到回报 → 于是裁员 → 被裁的人和数据标注员之间的差距越来越大。
评价真空 → 我们无法诚实评价AI → 科技公司可以无限地"画饼" → 公共讨论被技术乐观主义裹挟 → 没有人去问那些被遗忘的人的问题。

当这四个悖论叠加在一起，你会看到一幅完整的画面：AI正在把权力和财富向极少数人集中，而把成本和风险转嫁给最边缘的群体。

教皇看到的不是"技术是否进步"，而是"进步的成本由谁承担"。他给出的答案是：AI需要被"解除武装"——从竞争和垄断的逻辑中解放出来。

这听起来很理想主义。但物理学的事实是：一个正在缩小的资源池，必然会导致更激烈的争夺。 当纯净的人类数据变得越来越稀缺、当AI的边际收益递减、当评价体系失灵——那个"被争夺"的东西，就是权力。

四、从"看它能做什么"到"看它能不能养活自己"

我之所以称为"AI的第二幕危机"，是因为它们共同指向一个事实：

AI正在从"技术问题"变成"生态系统问题"。

第一幕的问题是："这个模型能做哪些令人惊叹的事情？"

第二幕的问题是：

它的食物（人类数据）够不够吃？
它的效率提升是真的还是幻觉？
我们有没有能力诚实评价它的好坏？
当它出了问题，我们能不能修？
它创造的价值，是被分享了还是被垄断了？
当它"吃掉"了自己生长的土壤，它会怎么办？

这些问题没有一个可以通过"更强的模型"来回答。

更强的模型需要更多的数据——但数据正在枯竭。更强的模型感觉上更快——但系统效率在下降。更强的模型生成的内容更难评价——但评价体系是真空。更强的模型系统更复杂——但维护能力没有跟上。更强的模型消耗更多算力——但成本在集中，收益在分化。

这就是为什么我说"第二幕"比"第一幕"难得多。 第一幕只需要技术突破。第二幕需要社会创新。

那怎么办？基于以上的分析，我有三条非共识的判断：

判断一：未来十年最稀缺的资源不是算力，不是模型能力——而是经过验证的、人类生成的、结构化的数据。 谁掌握了这个资源的持续供给，谁就能打破"模型崩溃"的诅咒。这意味着数据溯源、数据治理、数据经济会成为比模型训练更重要的赛道。

判断二：AI行业的赢家不会是模型最强的公司，而是"评价体系"最完善的公司。 在"皇帝的新衣"里，最终获利的不是裁缝（AI公司），而是那个说实话的小孩。谁能建立可信的AI质量评价标准，谁就拥有了行业话语权。

判断三：代理人（Agent）的瓶颈不是智能，不是推理——而是可维护性。 正如软件工程的突破不是"能写出更长的代码"，而是"能维护更复杂的系统"（版本控制、CI/CD、代码审查、重构方法论），AI Agent的突破也不会是"更聪明"，而是"更容易维护"。谁解决了"代理债"的问题，谁就真正解锁了Agent时代。