AI 正在自己学会犯错——这一轮进化,和以前不一样你有没有注意到,大模型的战事,正在悄悄换了一个打法?过去两年,AI 的进化叙事一直是"更大":参数更大、数据更多、算力更强。但从这周开始,这个故事的内核变了——聪明这件事,正在从"喂进去"变成"自己长出来"。两条新闻放在一起看,特别有意思。第一条来自 Anthropic。 这家公司刚刚发布了一个叫"Dreaming"(做梦)的系统,简单说就是:让 AI Agent 在执行任务失败后,不是简单重来,而是在后台模拟一遍"如果当时这样做会怎样",从模拟失败中提取经验,反哺下一次决策。同时,他们把 Multi-agent orchestration(多智能体编排)从研究预览正式推向 beta。这意味着企业可以同时调度多个 AI Agent 协同工作,而不是一个一个轮流来。第二条来自 OpenAI。 GPT-5.5 Instant 版推送了"记忆可视化"功能——你现在能看到,ChatGPT 的回答背后,是哪段记忆在起作用。虽然还不是完整的"记忆系统",但这是第一次,大模型开始向用户展示"我怎么想的"。这两个新闻,一个关于自我反思,一个关于自我认知。放在一块,指向一个明确的信号:AI 正在从被动工具,变成有"内在过程"的系统。为什么这件事重要?因为过去大模型最大的瓶颈,从来不是"不够聪明",而是"不知道自己什么时候不聪明"。你在用 AI 的时候,有没有遇到过这种情况:AI 信心满满地给了一个错误答案,还说得头头是道?背后的问题是:模型没有能力对自身的可靠性进行评估——它不知道自己不知道。"Dreaming"尝试解决的,正是这个。Anthropic 让 Agent 在后台跑"反事实模拟":不是简单告诉你错了,而是生成一个替代版本的自己,去试"如果用另一种方法做,结果会不会不同"。这个过程会产生大量有价值的学习信号,模型从中提取模式,下次遇到同类任务时就能用上。这不是传统意义上的"训练",而是一种实时的、自监督的自我改进。与此同时,中国这边的战事同样热闹。小红书这周正式成立了 AI 一级部门"Dots",由总裁直接领导。这家以"真实生活分享"见长的社区,终于把 AI 放到了最高优先级。在此之前,小红书的 AI 产品"点点"表现并不算成功——App Store 排名一百开外,评分寥寥。但这次组织升级,说明管理层已经认定:社区的下一个变量,不是电商,是 AI。同一天,华为问界 M6 上市,25.98 万的起售价,全系标配华为乾崑智驾 ADS 4.1 和 896 线激光雷达。激光雷达这种配置,过去是 30 万以上车型的专属。这不只是"卷价格",而是"高阶智驾平权"——把自动驾驶能力从高端车下沉到主流价格带。还有一个值得关注的项目:灵御智能。这是一支清华背景的创业团队,做具身智能(就是能理解物理世界、能操作的 AI),拿到了华映资本等国字号机构的天使轮融资。他们的路线很有意思:不追求把"大脑"装在机器人本体里,而是把认知推理放在云端,本地只留一个"小脑"管实时控制。好处是成本大幅下降,坏处是——你得时刻有网。回到开头的问题:这一轮 AI 进化,和以前有什么不同?以前的进化是被动的,靠人类喂数据、标数据、调参数。现在的进化是主动的,模型开始有自己的"试错—反思—改进"循环。这个转变意味着什么?我有三点判断:第一,AI 能力的上限,正在从"模型本身"变成"使用方式"。 同样一个 GPT-5,一个只会简单提问的用户和一个懂得设计工作流的用户,用出来的效果可能差 10 倍。Agent 的自我改进能力越强,如何引导它改进就越成为核心技能。第二,智驾的军备竞赛,从"有没有"进入"贵不贵"。 华为把激光雷达和高级智驾下沉到 25 万级,意味着 2026 年之后,买车不考虑智驾能力的消费者会越来越少。这个市场的教育期基本结束了。第三,国内大厂在 AI 产品化上,仍然在"补课"。 小红书的困境说明,有流量、有数据,不等于有 AI 产品力。从"拥抱 AI"到"用 AI 解决真实问题",中间隔着的不是钱,是产品和组织的基因改造。2026 年的 AI 战场,正在从"军备竞赛"变成"自我进化竞赛"。谁能让模型更聪明地犯错、更快地纠错,谁就站在下一个台阶上。你准备好了吗?