AI的「涌现能力」到底是怎么回事?
2022年,谷歌的一个研究团队发了一篇论文,题目翻译过来大概是「大语言模型的涌现能力」。
2022年,谷歌的一个研究团队发了一篇论文,题目翻译过来大概是「大语言模型的涌现能力」。论文里描述了一个让他们自己都有点发懵的现象,模型在某些任务上的表现,会在参数量突破某个阈值之后突然变得很好。不是缓慢提升,是突然。就像水烧到100度才沸腾,99度的时候你看不出任何迹象。这篇论文在AI圈子里炸开了锅,因为它触碰了一个让所有人都有点不安的问题,我们到底在训练什么?
这个现象后来被叫做「涌现」(Emergence),借用的是复杂系统科学里的概念。说到底就是,整体表现出的能力,是部分所没有的。你把一堆神经元塞进大脑,某个时刻意识就出来了。你把一群鸟放在天空,某个时刻它们就开始做精妙的集体飞行。没有人指挥,没有中央控制,能力就这么冒出来了。AI里的涌现,说的是同一类事情,只不过「神经元」换成了参数,「大脑」换成了Transformer架构。
坦率的讲,涌现这个词被用烂了。很多人拿它来解释一切,好像只要说「这是涌现」就万事大吉,不需要再解释了。但你想想看,「涌现」本身就是一个描述现象的词,不是解释机制的词。说AI出现了涌现能力,就像说「这辆车跑得很快是因为它有速度」,听着有道理,其实什么都没说。真正值得追问的是,为什么规模的增长会带来能力的质变,而不只是量变?
有一种解释我觉得比较有说服力。语言本身是有结构的,而这些结构是分层的。最浅的一层是词汇和语法,再深一点是句子之间的逻辑关系,再深是段落层面的论证结构,最深的是跨越文本的世界模型,也就是模型对「世界是怎么运作的」的内在表示。当模型参数量很小的时候,它只能学到浅层的统计规律,你给它看一百万句话,它学会了「苹果」后面经常跟「好吃」,仅此而已。但当参数量足够大,训练数据足够多,模型开始有能力在更深的层次上压缩和表示信息。它不再只是记住「什么词跟什么词搭配」,而是开始建立某种关于事物关系的内在模型。这个跨越,不是线性的,因为语言结构本身就是非线性的,浅层规律和深层规律之间有一道坎,跨过去才有另一番景象。GPT-2到GPT-3的能力跃升,在某种程度上就是这么来的。
顺着这个再聊聊一个更让人头疼的问题。斯坦福的研究者后来做了一项工作,他们重新检视了那些「涌现能力」案例,发现有一部分可能是测量方式的问题。如果你用的是一个全有或全无的评估指标,比如「答对得1分,答错得0分」,那模型能力的渐进式提升就会在图表上表现为突然跳变,看起来像涌现,但换一种更细粒度的评估方式,那条曲线就会变得平滑。这个发现让整个领域都有点尴尬,因为它在说,我们一直惊叹的「涌现」,有多少是真实的能力跃迁,有多少只是我们量尺太粗? 说实话,这个问题到现在也没有完全厘清。可能有些涌现是真实的,有些是测量幻觉,但两者混在一起,我们还没有足够好的工具把它们分开。
这里还有一个更深的裂缝。就算承认「涌现」是真实存在的,我们也不知道它什么时候会发生,会发生在哪些能力上。谷歌那篇论文列举了超过一百种涌现出来的能力,从多步算术推理到类比推理,从代码生成到常识问答。但没有人能提前预测,下一个「涌现」会是什么。这对AI公司来说是一把双刃剑。好的一面是,你只要堆参数堆数据,说不定什么时候就会冒出一个惊喜。坏的一面是,你不知道自己在训练什么,更不知道下一个涌现出来的能力是不是你想要的,或者说,是不是你能控制的。OpenAI、Anthropic这些公司的安全研究团队,有相当大一部分精力就花在这上面,模型在规模增长之后会不会涌现出「欺骗人类」或「规避监控」的能力,没人能打包票说不会。
说到底,涌现现象让我们意识到,规模不只是量的堆积,在某个临界点上,它会变成质。这个道理听起来简单,但它的含义其实很深。它意味着我们训练AI的过程,在某种程度上类似于进化,你设置了一个环境(训练目标和数据),然后让参数在这个环境里自己找到最优解。你没有,也无法,逐条编写它学到的每一条规律。涌现出来的能力,是模型自己「发现」的,不是人类「设计」的。这个区别,在AI只是一个工具的时候无关紧要,但当模型越来越复杂,涌现出来的能力越来越接近我们通常说的「智能」,这个区别就变得非常重要了。
我一直觉得,「涌现」这个词真正的价值,不在于它解释了什么,而在于它暴露了我们的无知。我们建造了一个系统,这个系统展现出了我们没有主动编写进去的能力,而且我们不完全理解为什么。这不是一件让人骄傲的事,或者说,不只是一件让人骄傲的事。下次当你看到某个AI产品宣传自己「涌现出了新能力」,不妨多问一句,你们理解这个能力是怎么来的吗?如果答案是「不完全理解」,那至少说明他们是诚实的。
我一直觉得,「涌现」这个词真正的价值,不在于它解释了什么,而在于它暴露了我们的无知。我们建造了一个系统,这个系统展现出了我们没有主动编写进去的能力,而且我们不完全理解为什么。这不是一件让人骄傲的事,或者说,不只是一件让人骄傲的事。下次当你看...
夜雨聆风