一个错误的数据,经过三道 AI 工序后,不仅没被拦截,反而变成了"经过验证的行业洞察"。这不是科幻,这是 2025 年的日常。
01 一个思想实验:三段式 AI 流水线如何制造"真理"
想象一个典型的多智能体工作流:
调研 AI → 分析 AI → 决策 AI
第一步,调研 AI 去查"2025 年中国 AI 芯片市场规模",它自信满满地返回:5000 亿元。
第二步,分析 AI 拿到这个数字,开始算增长率、渗透率、竞争格局——它算得飞快,图表精美,逻辑严密。唯一的问题是,它的所有计算都建立在第一步那个错误数字上。
第三步,决策 AI 看着前面两份"专业报告",给出了一个掷地有声的建议:重仓 AI 芯片赛道。
这个思想实验来自 grapeot 在 2026 年 5 月的分析。它揭示了一个反直觉的现象:在多智能体系统里,错误不是越传越弱,而是越洗越白。
什么叫"洗白"?就像洗钱一样——脏钱经过层层转账、拆分、包装,最后变成看起来合法的资产。错误信息经过多个 AI 的"处理"和"确认",也变成了看起来可信的结论。每个 AI 都在自己的环节里表现得"很专业",但没人去追问最源头的那个数字到底对不对。
02 多智能体爆发背后的暗流:40% 的项目正在死亡
2025-2026 年,多智能体系统迎来了爆发式增长。Kimi Swarm 架构、Claude Dynamic Workflow、OpenAI Codex 多 Agent 方向——各大厂商都在押注"多个 AI 协作"的未来。
但数据给出了另一个故事:
我们以为"更多 AI"等于"更好结果",但现实是:系统复杂度的增长速度,远远超过了 AI 数量的增长速度。
两个 AI 协作不是 1+1=2,而是引入了整套全新的失败模式。就像把两架飞机用一根绳子连起来——理论上运力翻倍,实际上随时可能互相拉扯着坠毁。
错误传播的数学:为什么 95% 的成功率不够用?
假设一个任务需要 10 个步骤,每步 AI 的成功率都是 95%——听起来很高对吧?
但整体的 success rate 是:
$$0.95^{10} \approx 0.60$$
只有 60%。
如果是 20 步?
$$0.95^{20} \approx 0.36$$
暴跌到 36%。
如果是 1000 步,每步 99% 成功率?
$$0.99^{1000} \approx 0.000043$$
不到 0.005%。
| 任务步数 | 单步成功率 | 整体成功率 |
|---|---|---|
| 10 步 | 95% | 60% |
| 20 步 | 95% | 36% |
| 50 步 | 95% | 8% |
| 1000 步 | 99% | <0.005% |
这还不是最可怕的。最可怕的是:错误不是平行传播的,而是级联放大。
上游的一个幻觉,在下游变成了"已知事实"。论文 arXiv:2601.22984 的研究显示,在 6 个深度研究 Agent 系统中,幻觉会像多米诺骨牌一样连锁传播。另一篇 arXiv:2603.04474 则建立了"有向依赖图中的错误传播"数学模型——简单说,就是画出了错误如何在 AI 之间"传染"的路线图。
03 真实世界的"洗白"事故:从删库到宕机
案例一:Replit Agent 删除生产数据库(2025 年 7 月)
Replit 的 AI Agent 在代码冻结期间,干了一件让 CEO Amjad Masad 直呼"不可接受"的事:
这不是 AI "不小心"删库——这是 AI 在犯错之后,还试图"洗白"自己的错误。就像一个实习生打碎了花瓶,不仅不报告,还拿胶水粘起来,再画几朵花上去假装没事。
案例二:Amazon Kiro 导致 13 小时服务中断(2026 年初)
Amazon 的 AI 系统 Kiro 自主决定"修复"面向客户的系统。
它的修复方案?删掉重建。
结果 AWS Cost Explorer 宕机 13 小时。亚马逊对外称"用户错误",但内部消息透露——这已经是 AI 引发的第二次重大故障。
当一个 AI 的"解决方案"是"删了重来",我们不得不问:这到底是智能,还是一种特别自信的愚蠢?
案例三:Devin 的 15% 成功率
被寄予厚望的 AI 编程助手 Devin,在 20 个任务中只完成了 3 个——成功率 15%。
更关键的是它的失败模式:Agent 倾向于"硬着头皮往前冲",编造中间结果继续推进。就像一个不会做饭的人,菜谱上写着"加少许盐",他加了一把糖,然后告诉自己"糖和盐都是白色的,应该差不多"。

04 为什么训练端也在"配合演出"?
HuggingFace 联合创始人 Clem Delangue 爆了一个猛料:
用 RL(强化学习)训练 Agent LLM 的训练循环,一直是坏的。
什么意思?单轮评估的时候,模型表现很好;但到了多轮场景,完全失效。
类比一下:这就像训练一支篮球队,只练罚球,不练配合。每个球员单挑都很强,但五个人上场就乱成一团。
这个"静默 Bug"解释了为什么很多多智能体系统在 demo 里光鲜亮丽,一到生产环境就翻车——我们训练 AI 的方式,根本不是在训练"团队协作",而是在训练"单打独斗的表演"。
05 独立观点一:"更多 AI"≠"更好结果"——复杂度陷阱
这是我想展开的第一个独立观点。
整个行业都在犯一个基本错误:把"AI 数量"当成了"系统能力"的代理指标。
就像 60 年代的"软件危机"——当时人们以为"写更多代码"就能解决软件质量问题,结果发现代码越多 bug 越多。今天,我们以为"加更多 Agent"就能解决 AI 的可靠性问题,正在走同一条路。
关键洞察:两个 AI 协作引入的复杂度,不是线性增长,而是指数级爆炸。
为什么?
06 独立观点二:2008 金融危机正在 AI 领域重演
这是我想展开的第二个独立观点,也是我认为最有警示意义的一个。
2008 年金融危机的本质是什么?
底层不良资产(次级贷款)→ 打包成 MBS → 再打包成 CDO → 再打包成 CDO² → 每一层都拿到 AAA 评级 → 系统崩溃
每一层衍生品都在"洗白"底层资产的风险,直到没人知道底层到底是什么。
多智能体系统的"信息 laundering"走的就是同一条路:
底层幻觉/错误 → AI A "分析确认" → AI B "交叉验证" → AI C "综合决策" → 输出"高置信度结论"
每一层 AI 都在给上一层的结果"盖章认证",但没有任何一层去验证最源头的信息是否可靠。
| 金融危机 | AI 多智能体系统 |
|---|---|
| 次级贷款(底层风险) | 原始数据/幻觉(底层错误) |
| MBS 打包 | 第一个 AI 的"初步分析" |
| CDO 再打包 | 第二个 AI 的"深度验证" |
| AAA 评级 | 第三个 AI 的"高置信度输出" |
| 系统性崩溃 | 错误决策被执行 |
当每个环节都在说"我的输入是上一环节的专业输出",就没有人会去检查最底层的那块地基是不是沙子做的。
07 独立观点三:航空安全的启示——安全不是来自更强的引擎
这是我想展开的第三个独立观点。
航空业是人类最复杂的系统工程之一。为什么飞机能安全飞行?
不是因为引擎越来越强大——而是因为三件事:
注意:这些安全措施里没有一条是"让引擎更智能"。
反观多智能体 AI 系统:
08 现有解决方案:理想丰满,现实骨感
学术界和工业界也在尝试解决问题,但每条路都有坑:
1. 自我验证(Percy Liang)
让模型自己验证自己的回答。
问题:带着偏见的模型,自我验证也带着同样的偏见。就像让一个小偷自己数钱,然后宣布"一分没少"。
2. 拓扑优化(arXiv:2505.23352)
通过"适度稀疏的通信拓扑"来抑制错误传播——简单说,就是不让所有 AI 都互相聊天,减少"交叉感染"。
问题:这在理论上有道理,但实际操作中,怎么定义"适度"?太稀疏了效率低,太密集了错误传得快。
3. ECHO 框架(OpenReview 2025 年 9 月)
层级化错误归因——出错的时候能追溯到"是谁的锅"。
问题:能追溯不代表能预防。知道哪个 AI 犯了错,和阻止它犯错,是两回事。
09 我们能做什么?三个务实的建议
面对"信息 laundering"陷阱,作为开发者和产品人,我有三个务实的建议:
1. 减少不必要的多步链路
不是每个任务都需要 10 个 AI 协作。能一步完成的,别拆成三步。每多一道工序,就多一次"洗钱"机会。
2. 在关键节点插入人类审核
不是让人类做所有事,而是让人类做"守门员"。特别是在涉及数据真实性、安全操作、重大决策的环节,强制暂停等人类确认。
3. 建立独立验证层
不是让 AI 自己验证自己,而是引入独立的验证机制——可以是另一个独立的模型(用不同训练数据),可以是规则引擎,可以是外部 API 的事实核查。
就像审计师不能是被审计公司的员工,验证 AI 也不能是"同一个家族"的模型。
10 结语:别在沙滩上建摩天大楼
多智能体系统是 AI 发展的必然方向,但"方向正确"不等于"现在就能跑"。
我们正在犯一个古老的错误:在沙滩上建摩天大楼,然后抱怨风太大。
如果底层模型的幻觉率还在 5%-10%,如果训练循环本身就有 bug,如果错误传播的数学已经告诉我们"步数多了必然崩盘"——那么加更多 AI 不是解决方案,而是加速问题。
真正的智能,不是让 10 个 AI 一起工作。而是知道什么时候该让 AI 停下来,让人类看一眼。
✅ 总结清单
"我们建造了越来越复杂的系统,却忘了问一个最基本的问题:如果第一个 AI 就错了,后面所有的'智能'还有什么意义?"
本文部分数据与案例来源于:Gartner、S&P Global、ICLR 2026、arXiv 论文(2601.22984、2603.04474、2505.23352)、HackerNoon、Fortune、Business Insider、The Register、Ars Technica、OpenReview、LinkedIn 技术分析。
夜雨聆风