AI时代的认知操作系统:终极环境,人是被蒸馏出来的

2015年，Geoffrey Hinton、Oriol Vinyals和Jeff Dean发表了一篇论文：《Distilling the Knowledge in a Neural Network》。

论文做的事其实很简单：你先训练好一个庞大但聪明的神经网络（教师模型），然后你想再训练一个小得多的网络（学生模型）。

以前的做法是让学生直接去学原始数据。但Hinton他们发现了一条更简单的路：学生模型不需要在原始数据集上训练，只需要学习教师模型的输出分布，就能把教师模型的全部知识内化。今天强化学习里提出的on-policy distillation，思路同样精妙。

这个过程就叫蒸馏。最后留下来的那个参数量更小的学生模型，已经把老师知道的继承了下来。

人也是这样被蒸馏出来的。人的教师，就是环境。

你的训练数据就在身边

我们总以为学习只发生在课堂和书本里，其实不是。大脑是一个持续运行的生成模型，不断生成预测，不断接收反馈，不断进行修正。

你跟一个人待在一起时，你的大脑就在自动学习TA的表达方式、思维的节奏、情绪的反应。这不代表你没主见，而是大脑觉得：跟我在同一个环境里的人，大概率面对的是同一个世界。所以它会自动地调整参数。

你进入一个团队，这个团队有自己的共享模型：什么才算重要，什么才算成功，什么事情值得紧张。你不需要任何人向你解释，只要泡在那个环境里，你的预测模型就开始对齐了。慢慢地，你讲话的方式、做事的风格、做决定时看重什么、甚至什么事会让你情绪波动，全都变了。

这就是蒸馏。环境是教师，你是学生。即使你从未意识到，你的参数也在通过频繁而微小的调节，固执地与环境对齐。

所以你现在每天接触的人、事、信息，正在把你蒸馏成什么样的人？

刷短视频时：你的注意力被轻易收割，越来越没耐心去做长期投入的事，慢慢习惯了“看完划走、什么都不往心里去”的状态。

和朋友们聊八卦时：你不自觉地开始跟人比较，什么算成功的标准，就在一次次闲聊里悄悄刻进了脑子里。

待在一个保守的团队工作时：什么事是可能的，什么是不可行的，你心里这个上限会被一点一点压低，渐渐觉得好多事情根本不现实。

你每天的日常，都是在提交一份训练集。然后你的大脑，会一丝不苟地跑完每一次参数更新。

有一种知识，永远不能被写成文字

这就带来一个问题：如果环境就是那个塑造我们的东西，那我能不能全靠读书、听课，给自己造出一个完整的环境？

理论上可以。但有一种知识，是文字记录不了的。

1966年，Michael Polanyi在《The Tacit Dimension》中写了这样一句话：“我们知道的，比我们能说出的多。”

你讲不清楚为什么你信任这个人，讲不清楚为什么你觉得这个方向是对的，讲不清楚这个问题的答案为什么可能是这样。

Polanyi把这种知识叫作隐性知识。它最大的特点就是：没办法靠文字传递，只能在共同相处、身临其境中传递。

师父带徒弟，胜过任何一本教材；最好的创始人不是在课堂里学出来的；你进了一个好团队，自己的标准不知不觉就高了。

不是有谁专门教你，是你感受到的那种微妙的环境变化了。你的判断、你的感觉，都会在无声中向他们靠拢。这个过程不需要语言，你只要待在那里就行。

这就是为什么“看了那么多书，生活还是没什么变化”。书给你的，是显性知识，就是那些能写出来的部分。但隐性知识是写不出来，你需要自己去接触、去感受、去实践。

人是非结构化的学习者

前面说有些知识是写不下来的。但还有一个更根本的原因：就算能写成文字，人也不是天生就会按书本组织的方式去学的。

现代教育的设计：课程大纲、教科书、标准化考试、分科制。在人类历史上其实出现得很晚。学校教育大规模普及，也就最近两百年的事。而大脑的基本构造在过去二十万年里几乎没怎么变过。

这就意味着，大脑的设计并不是为课堂准备的。

人类天生擅长什么样的学法？观察、模仿、泡在里面、不断试错、身临其境。

一个小孩学说话，不需要语法书，只要跟说那种话的人待在一起就行。研究表明，即使刚会开口的婴儿也能理解时态和语法结构。一个学徒学手艺，不需要标准操作流程，只要看师父怎么做，自己上手试，做得不对被指点一下。

这些全都是没有固定结构、全靠环境驱动的学习。接收到的信息是杂乱的，跟当时的具体情境绑在一起，里面藏着大量说不清道不明的东西。

人类大脑默认的设置不是“系统化地吸收知识”，而是靠在环境里浸泡，不知不觉地被改变。

比如学习这件事，本来也应该是一个到处摸索的过程：你不断地去发现各种联系，察觉各种区别，自由自在地游走，而不是对着一块切得方方正正的大纲，逼着自己硬往下啃。

这就能解释很多让人想不通的事了。为什么你听了一场讲座，第二天就差不多忘掉了？因为讲座是条理分明的输入。为什么你在一个好团队里待了三个月，也没谁特意教你什么，自己却像换了个人？因为浸泡提供的，是那种没有结构的输入。

你的工具在蒸馏你

训练数据不只是你周围的人。你用的每一个工具，也在塑造着你。

1998年，Andy Clark和David Chalmers发表了一篇论文《The Extended Mind》。核心论点是：如果外部世界中的某个实体与人的大脑形成了可靠的双向耦合，那么那个实体就是人的认知系统的一部分。他们用的例子是一个阿尔茨海默症患者：他把所有记忆写在一个笔记本上，走到哪带到哪，查阅笔记本的动作和常人"努力回忆"的动作在功能上没有区别。因此Clark 和 Chalmers 的结论是：笔记本不是工具。笔记本就是这个人的记忆。

顺着这个逻辑往下推：你的手机不只是手机。你用的IDE不只是IDE。你写作的语言也不只是语言。

用命令行的人，对计算机是什么的理解，会被蒸馏成“我发指令，系统响应”。

用图形界面的人，对计算机是什么的理解，会被蒸馏成“我看见图标，我再点击”。

用英文写作的人，逻辑结构被语言本身蒸馏。语言不只是表达思想的工具，语言在反向塑造什么能被思考。

这个观点叫语言相对性假说。语言并不决定思维，但语言确实会影响思维的惯性路径。

尼采晚年换上了打字机写作，他的文字越来越简短，写作风格最终变得完全不同。

你不只是在选择工具，工具本身也在塑造你。

悖论：你的模型改不了你的模型

到这里，一个显而易见的推论就是：如果一个人能精心选择自己的输入，就能塑造自己。

这在逻辑上是对的。但实际上有一个致命的悖论：调整输入这件事，需要你已经在用那个更理想的自我模型了。

当你沉迷短视频的时候，你的大脑已经被蒸馏成只看眼前、没有耐心的状态。让这个状态的大脑去精心选择更好的输入，它大概率做不到。因为你的模型连识别好训练数据的能力，都已经被糟糕的训练数据污染了。

这就是自由能原理的核心困境：你就是你的模型本身。改变你最难的，是用你的模型去改变你的模型。

那怎么办？有一个解法，非常简单，甚至像是在作弊。

把自己放进一个你暂时还配不上的环境里。

你需要的不是“我要变好”，而是“我周围的人都已经比我更好”。

加入一个团队、报名一个课程、搬到一个城市、做一件你暂时觉得自己接不住的事，然后让你的预测模型接收现实更强力的反馈。

所以，你不需要更自律，你只需要更高的“损失值”。

这个逻辑在心理学里也有对应：Jim Coan提出了社会基线理论表示人类的大脑默认把亲密他人的存在，当作一个前提条件。

回到桥上，换一条河

今天说到“把自己放进配不上的环境”，和以前听过的“逼自己一把”不是完全相同的。

“逼自己一把"是让意识继续掌权：可能会列满当当的计划、可能要求自己每天早起、可能在每一次想停下来的时候对自己喊“意志力不够”。这仍然是被理性支配着的生活。

可以参考之前的文章：

AI时代的人类认知操作系统：如何重塑生活、理性的暴政

但这里说的是：换一条河。你不需要游。你只需要跳进去。河流会把你冲到你要到的地方。

人类的大脑不是为意志力、理性设计的，它是为沉浸、自由设计的。你在一个环境里，你的模型自然会蒸馏，不需要你努力，不需要你自律，不需要任何计划。你只需要在那里。