AI时代的认知操作系统:终极环境,人是被蒸馏出来的2015年,Geoffrey Hinton、Oriol Vinyals和Jeff Dean发表了一篇论文:《Distilling the Knowledge in a Neural Network》。论文做的事其实很简单:你先训练好一个庞大但聪明的神经网络(教师模型),然后你想再训练一个小得多的网络(学生模型)。以前的做法是让学生直接去学原始数据。但Hinton他们发现了一条更简单的路:学生模型不需要在原始数据集上训练,只需要学习教师模型的输出分布,就能把教师模型的全部知识内化。今天强化学习里提出的on-policy distillation,思路同样精妙。这个过程就叫蒸馏。最后留下来的那个参数量更小的学生模型,已经把老师知道的继承了下来。人也是这样被蒸馏出来的。人的教师,就是环境。你的训练数据就在身边我们总以为学习只发生在课堂和书本里,其实不是。大脑是一个持续运行的生成模型,不断生成预测,不断接收反馈,不断进行修正。你跟一个人待在一起时,你的大脑就在自动学习TA的表达方式、思维的节奏、情绪的反应。这不代表你没主见,而是大脑觉得:跟我在同一个环境里的人,大概率面对的是同一个世界。所以它会自动地调整参数。你进入一个团队,这个团队有自己的共享模型:什么才算重要,什么才算成功,什么事情值得紧张。你不需要任何人向你解释,只要泡在那个环境里,你的预测模型就开始对齐了。慢慢地,你讲话的方式、做事的风格、做决定时看重什么、甚至什么事会让你情绪波动,全都变了。这就是蒸馏。环境是教师,你是学生。即使你从未意识到,你的参数也在通过频繁而微小的调节,固执地与环境对齐。所以你现在每天接触的人、事、信息,正在把你蒸馏成什么样的人?刷短视频时:你的注意力被轻易收割,越来越没耐心去做长期投入的事,慢慢习惯了“看完划走、什么都不往心里去”的状态。和朋友们聊八卦时:你不自觉地开始跟人比较,什么算成功的标准,就在一次次闲聊里悄悄刻进了脑子里。待在一个保守的团队工作时:什么事是可能的,什么是不可行的,你心里这个上限会被一点一点压低,渐渐觉得好多事情根本不现实。你每天的日常,都是在提交一份训练集。然后你的大脑,会一丝不苟地跑完每一次参数更新。有一种知识,永远不能被写成文字这就带来一个问题:如果环境就是那个塑造我们的东西,那我能不能全靠读书、听课,给自己造出一个完整的环境?理论上可以。但有一种知识,是文字记录不了的。1966年,Michael Polanyi在《The Tacit Dimension》中写了这样一句话:“我们知道的,比我们能说出的多。” 你讲不清楚为什么你信任这个人,讲不清楚为什么你觉得这个方向是对的,讲不清楚这个问题的答案为什么可能是这样。Polanyi把这种知识叫作隐性知识。它最大的特点就是:没办法靠文字传递,只能在共同相处、身临其境中传递。师父带徒弟,胜过任何一本教材;最好的创始人不是在课堂里学出来的;你进了一个好团队,自己的标准不知不觉就高了。不是有谁专门教你,是你感受到的那种微妙的环境变化了。你的判断、你的感觉,都会在无声中向他们靠拢。这个过程不需要语言,你只要待在那里就行。这就是为什么“看了那么多书,生活还是没什么变化”。书给你的,是显性知识,就是那些能写出来的部分。但隐性知识是写不出来,你需要自己去接触、去感受、去实践。人是非结构化的学习者前面说有些知识是写不下来的。但还有一个更根本的原因:就算能写成文字,人也不是天生就会按书本组织的方式去学的。现代教育的设计:课程大纲、教科书、标准化考试、分科制。在人类历史上其实出现得很晚。学校教育大规模普及,也就最近两百年的事。而大脑的基本构造在过去二十万年里几乎没怎么变过。这就意味着,大脑的设计并不是为课堂准备的。人类天生擅长什么样的学法?观察、模仿、泡在里面、不断试错、身临其境。一个小孩学说话,不需要语法书,只要跟说那种话的人待在一起就行。研究表明,即使刚会开口的婴儿也能理解时态和语法结构。一个学徒学手艺,不需要标准操作流程,只要看师父怎么做,自己上手试,做得不对被指点一下。这些全都是没有固定结构、全靠环境驱动的学习。接收到的信息是杂乱的,跟当时的具体情境绑在一起,里面藏着大量说不清道不明的东西。人类大脑默认的设置不是“系统化地吸收知识”,而是靠在环境里浸泡,不知不觉地被改变。比如学习这件事,本来也应该是一个到处摸索的过程:你不断地去发现各种联系,察觉各种区别,自由自在地游走,而不是对着一块切得方方正正的大纲,逼着自己硬往下啃。这就能解释很多让人想不通的事了。为什么你听了一场讲座,第二天就差不多忘掉了?因为讲座是条理分明的输入。为什么你在一个好团队里待了三个月,也没谁特意教你什么,自己却像换了个人?因为浸泡提供的,是那种没有结构的输入。你的工具在蒸馏你训练数据不只是你周围的人。你用的每一个工具,也在塑造着你。1998年,Andy Clark和David Chalmers发表了一篇论文《The Extended Mind》。核心论点是:如果外部世界中的某个实体与人的大脑形成了可靠的双向耦合,那么那个实体就是人的认知系统的一部分。 他们用的例子是一个阿尔茨海默症患者:他把所有记忆写在一个笔记本上,走到哪带到哪,查阅笔记本的动作和常人"努力回忆"的动作在功能上没有区别。因此Clark 和 Chalmers 的结论是:笔记本不是工具。笔记本就是这个人的记忆。顺着这个逻辑往下推:你的手机不只是手机。你用的IDE不只是IDE。你写作的语言也不只是语言。用命令行的人,对计算机是什么的理解,会被蒸馏成“我发指令,系统响应”。用图形界面的人,对计算机是什么的理解,会被蒸馏成“我看见图标,我再点击”。用英文写作的人,逻辑结构被语言本身蒸馏。语言不只是表达思想的工具,语言在反向塑造什么能被思考。这个观点叫语言相对性假说。语言并不决定思维,但语言确实会影响思维的惯性路径。尼采晚年换上了打字机写作,他的文字越来越简短,写作风格最终变得完全不同。你不只是在选择工具,工具本身也在塑造你。悖论:你的模型改不了你的模型到这里,一个显而易见的推论就是:如果一个人能精心选择自己的输入,就能塑造自己。这在逻辑上是对的。但实际上有一个致命的悖论:调整输入这件事,需要你已经在用那个更理想的自我模型了。当你沉迷短视频的时候,你的大脑已经被蒸馏成只看眼前、没有耐心的状态。让这个状态的大脑去精心选择更好的输入,它大概率做不到。因为你的模型连识别好训练数据的能力,都已经被糟糕的训练数据污染了。这就是自由能原理的核心困境:你就是你的模型本身。改变你最难的,是用你的模型去改变你的模型。那怎么办?有一个解法,非常简单,甚至像是在作弊。把自己放进一个你暂时还配不上的环境里。你需要的不是“我要变好”,而是“我周围的人都已经比我更好”。加入一个团队、报名一个课程、搬到一个城市、做一件你暂时觉得自己接不住的事,然后让你的预测模型接收现实更强力的反馈。所以,你不需要更自律,你只需要更高的“损失值”。这个逻辑在心理学里也有对应:Jim Coan提出了社会基线理论表示人类的大脑默认把亲密他人的存在,当作一个前提条件。回到桥上,换一条河今天说到“把自己放进配不上的环境”,和以前听过的“逼自己一把”不是完全相同的。“逼自己一把"是让意识继续掌权:可能会列满当当的计划、可能要求自己每天早起、可能在每一次想停下来的时候对自己喊“意志力不够”。这仍然是被理性支配着的生活。可以参考之前的文章:AI时代的人类认知操作系统:如何重塑生活、理性的暴政但这里说的是:换一条河。你不需要游。你只需要跳进去。河流会把你冲到你要到的地方。人类的大脑不是为意志力、理性设计的,它是为沉浸、自由设计的。你在一个环境里,你的模型自然会蒸馏,不需要你努力,不需要你自律,不需要任何计划。你只需要在那里。