＂涌现＂——AI突然变聪明的底层秘密

DEEP READ

深度阅读

2026年6月8日

"涌现"——AI突然变聪明的底层秘密

为什么GPT-2不会做数学，GPT-4却能解方程？

你有没有注意到一个奇怪的现象？

GPT-2做不了复杂数学，但给它足够多的参数、足够多的数据、训练足够久之后，GPT-4突然就会了——不是某个版本突然"学会"了解方程，而是一旦越过某个临界点，它就像被"点亮"了一样，新能力凭空冒了出来。

这种"量变引发质变"的现象，在AI领域有个专门的名字：涌现（Emergence）。这个词不是AI研究者发明的，它来自复杂性科学——研究蚂蚁群、鸟群、大脑神经元如何产生"超越个体"的集体行为的学问。

01 什么是涌现

用一个经典的例子解释：

单只蚂蚁很简单，只会循着气味走、搬食物、回巢穴。但当足够多的蚂蚁聚集在一起，没有"指挥官"的蚁群却能构建出精密的巢穴结构——有通风通道、有育婴室、有垃圾处理区。这种"超越单个蚂蚁能力边界的复杂行为"，就是涌现。

GPT家族也遵循同样的逻辑。你喂给它越来越多的文本，它的参数越来越多，训练过程越来越复杂——然后，某个临界点之后，它突然涌现出了你从来没专门教过它的能力：做数学题、写代码、翻译、甚至"推理"。

2022年，Google Research团队在一篇论文中系统研究了大语言模型的涌现能力。他们发现，涌现能力有三个关键特征：

① 不可预测性：你无法预测一个模型"在哪个参数量级"会涌现出某个能力——只能观察到它发生之后才知道。

② 跳跃式提升：能力不是线性增长的，而是在某个临界点突然"跳"出来。就像水到0度突然结冰，不是一点一点变硬，是突变。

③ 后向兼容性陷阱：一旦某个能力涌现，你再训练一个更小的模型去专门强化它，效果往往不如直接等大模型自然涌现。

02 为什么涌现会发生

这个问题目前没有完美的答案，但有几个被广泛认可的解释：

解释一：世界模型的压缩

当模型吸收了足够多的文本，它实际上是在"压缩"人类知识——把分散的事实、逻辑、因果关系压缩到一个参数网络里。当压缩到一定程度，模型不再只是"记忆"，而是开始"理解"——因为它被迫在有限的参数空间里找到一种"更高效的表示方式"，这种表示方式本质上就是对世界运作规律的理解。

解释二：子技能的组合

很多复杂能力，实际上是多个简单子能力的组合。比如"写出连贯的文章"，需要语法正确+词汇丰富+逻辑连贯+情感表达。当每个子能力都足够强，它们的组合效果会呈指数级增长，产生"1+1>2"的涌现效应。

解释三：量变到质变的临界效应

就像大脑神经元数量超过某个阈值后产生了"自我意识"，语言模型的参数规模超过某个临界点后，可能涌现出了某种"对语言深层结构的理解"。这不是拟人化，而是说：当系统复杂度超过某个阈值，系统内部开始产生"超越设计者预期的行为模式"。

有意思的是，涌现也意味着不可靠性。2023年，斯坦福大学的研究发现：大模型在某些任务上的表现存在"虚假涌现"——不是模型真的学会了，而是任务评价指标刚好和模型的某个特性对齐。换句话说，有些"涌现"可能是假象，是我们的测量方式有问题。

03 涌现对AI发展的意义

理解了涌现，你就理解了过去几年AI发展的几个关键现象：

现象一：为什么"大力出奇迹"成了主流？
因为涌现告诉我们：训练规模不够的时候，你不知道模型到底能做什么。一旦接近临界点，下一个量级可能就涌现出全新的能力。所以大厂愿意花几十亿美元赌"规模"——赌对了就是下一个GPT-4，赌错了就是几十亿美元的水电费。

现象二：为什么开源模型突然爆发？
Llama、DeepSeek等开源模型在某些任务上逼近GPT-4，不是因为某个研究者"发明"了什么新能力，而是因为开源社区通过不断优化架构和数据，让模型规模达到了涌现临界点。能力不是被"设计"出来的，是被"激发"出来的。

现象三：为什么AI能力难以预测？
每次新模型发布都说"能力大幅提升"，但没人能准确预测它能做什么、不能做什么。涌现的本质就是不可预测——你只能看到它发生，无法提前算出来。这也是为什么AI安全如此困难：你不知道模型下一秒会涌现出什么能力，也不知道那个能力是否危险。

6月7日，据《金融时报》报道，OpenAI正对ChatGPT进行2022年推出以来最大规模的改版，将其从聊天机器人升级为集成编程工具、AI智能体和第三方应用的"超级应用"。这个转型的底层逻辑，正是对涌现能力的押注——当模型足够大、足够通用，它就可以涌现出"执行复杂任务"的能力，而不仅仅是"回答问题"。

💡 最后

涌现告诉我们一个反直觉的真相：
AI不是被"编程"出来的智能，
而是被"激发"出来的。
就像种子需要足够的阳光和水才能发芽，
模型需要足够的规模和训练才能涌现能力。
这是AI最神秘的地方，也是它最让人敬畏的地方。

参考：Google Research论文"Emergent Abilities of Large Language Models"（Jason Wei等，TMLR 2022）、斯坦福大学"Are Emergent Abilities of Large Language Models a Mirage?"、OpenAI官方公告

深度阅读 · 不追热点，追真相

【免责声明】本内容仅供参考，不构成决策依据。图文版权归原作者所有，如有侵权请联系删除。