AI 正在自己学会犯错——这一轮进化,和以前不一样

你有没有注意到，大模型的战事，正在悄悄换了一个打法？

过去两年，AI 的进化叙事一直是"更大"：参数更大、数据更多、算力更强。但从这周开始，这个故事的内核变了——聪明这件事，正在从"喂进去"变成"自己长出来"。

两条新闻放在一起看，特别有意思。

第一条来自 Anthropic。这家公司刚刚发布了一个叫"Dreaming"（做梦）的系统，简单说就是：让 AI Agent 在执行任务失败后，不是简单重来，而是在后台模拟一遍"如果当时这样做会怎样"，从模拟失败中提取经验，反哺下一次决策。同时，他们把 Multi-agent orchestration（多智能体编排）从研究预览正式推向 beta。这意味着企业可以同时调度多个 AI Agent 协同工作，而不是一个一个轮流来。

第二条来自 OpenAI。 GPT-5.5 Instant 版推送了"记忆可视化"功能——你现在能看到，ChatGPT 的回答背后，是哪段记忆在起作用。虽然还不是完整的"记忆系统"，但这是第一次，大模型开始向用户展示"我怎么想的"。

这两个新闻，一个关于自我反思，一个关于自我认知。放在一块，指向一个明确的信号：AI 正在从被动工具，变成有"内在过程"的系统。

为什么这件事重要？

因为过去大模型最大的瓶颈，从来不是"不够聪明"，而是"不知道自己什么时候不聪明"。

你在用 AI 的时候，有没有遇到过这种情况：AI 信心满满地给了一个错误答案，还说得头头是道？背后的问题是：模型没有能力对自身的可靠性进行评估——它不知道自己不知道。

"Dreaming"尝试解决的，正是这个。Anthropic 让 Agent 在后台跑"反事实模拟"：不是简单告诉你错了，而是生成一个替代版本的自己，去试"如果用另一种方法做，结果会不会不同"。这个过程会产生大量有价值的学习信号，模型从中提取模式，下次遇到同类任务时就能用上。

这不是传统意义上的"训练"，而是一种实时的、自监督的自我改进。

与此同时，中国这边的战事同样热闹。

小红书这周正式成立了 AI 一级部门"Dots"，由总裁直接领导。这家以"真实生活分享"见长的社区，终于把 AI 放到了最高优先级。在此之前，小红书的 AI 产品"点点"表现并不算成功——App Store 排名一百开外，评分寥寥。但这次组织升级，说明管理层已经认定：社区的下一个变量，不是电商，是 AI。

同一天，华为问界 M6 上市，25.98 万的起售价，全系标配华为乾崑智驾 ADS 4.1 和 896 线激光雷达。激光雷达这种配置，过去是 30 万以上车型的专属。这不只是"卷价格"，而是"高阶智驾平权"——把自动驾驶能力从高端车下沉到主流价格带。

还有一个值得关注的项目：灵御智能。这是一支清华背景的创业团队，做具身智能（就是能理解物理世界、能操作的 AI），拿到了华映资本等国字号机构的天使轮融资。他们的路线很有意思：不追求把"大脑"装在机器人本体里，而是把认知推理放在云端，本地只留一个"小脑"管实时控制。好处是成本大幅下降，坏处是——你得时刻有网。

回到开头的问题：这一轮 AI 进化，和以前有什么不同？

以前的进化是被动的，靠人类喂数据、标数据、调参数。

现在的进化是主动的，模型开始有自己的"试错—反思—改进"循环。

这个转变意味着什么？我有三点判断：

第一，AI 能力的上限，正在从"模型本身"变成"使用方式"。同样一个 GPT-5，一个只会简单提问的用户和一个懂得设计工作流的用户，用出来的效果可能差 10 倍。Agent 的自我改进能力越强，如何引导它改进就越成为核心技能。

第二，智驾的军备竞赛，从"有没有"进入"贵不贵"。华为把激光雷达和高级智驾下沉到 25 万级，意味着 2026 年之后，买车不考虑智驾能力的消费者会越来越少。这个市场的教育期基本结束了。

第三，国内大厂在 AI 产品化上，仍然在"补课"。小红书的困境说明，有流量、有数据，不等于有 AI 产品力。从"拥抱 AI"到"用 AI 解决真实问题"，中间隔着的不是钱，是产品和组织的基因改造。

2026 年的 AI 战场，正在从"军备竞赛"变成"自我进化竞赛"。谁能让模型更聪明地犯错、更快地纠错，谁就站在下一个台阶上。