《贯通》~AI时代的知识与学习(第三卷)-夜雨聆风

《贯通》~AI时代的知识与学习(第三卷)

第四章：像AI一样学习

自从AI出现以来，我一直觉得AI是一个双刃剑，AI有可能从工作和经济上对人类社会造成巨大的冲击，造成人类社会的结构发生巨大的变化。如果AI有可能给人类带来好处的话，我认为这个好处不是生产力的提高，因为AI是否能提高整个公司和组织的生产力目前还是一个问号，AI能给人类带来的最大好处是作为一面人类理解自身的镜子。

人类和自身的工具之间一直是一种协同进化的过程，人类在使用工具的同时，人类的大脑也会因为工具而发生变化。现在这种协同计划的效应已经在使用AI的人群中发生了，有一些研究发现长期使用AI的人会出现认知能力的退化。工具既是人类发明的产物，同时也是我们理解人类行为的钥匙。

现在的AI无论多么复杂和高级，本质上都是对人脑神经元连接结构的模拟，所以说整个AI学科都是仿生学，都是在模仿人类和其他动物的大脑。所以我们构建人工智能的过程也是我们进一步理解动物和自身大脑的过程。今天的AI不是突然发展到今天的，AI经过的长期寒冬期对AI的技术积淀是一个巨大的好处，相反现在AI烈火烹油的巨大繁荣反而阻碍了AI的技术积淀。

在AI的寒冬期不同的学者尝试了不同的发展路线来解决AI面对的问题，理查德.萨顿贡献了基于时序差分的强化学习，杰佛里.辛顿贡献了反向传播算法，福岛邦彦贡献了卷积算法等等。这些算法在本质上都是对动物和人类大脑中算法的模仿，杨立昆直接说了他的算法的灵感来源就是猫的视觉神经皮层的结构，强化学习在猫，狗等哺乳动物的学习过程中是一种普遍存在的现象。

既然AI的发展是基于对人脑和动物大脑的模仿，AI的进步在很大程度上就能变成我们理解动物和自身大脑与智能的一面镜子。我们要思考一下：AI为什么能在学习人类语言的过程中如此高效？我前面说过，任何学习的过程都是压缩和提炼的过程，而知识不仅是一个压缩出来的产品，同时也是这个压缩过程本身。既然AI和人脑都是通过压缩来从信息中压缩出知识，那么我们在压缩知识的过程中能不能从AI那获取一些借鉴呢？当然可以，而且借鉴意义很大。

早期的AI只能解决一些简单的逻辑和规则定义清晰的问题，稍微复杂一点儿的问题就能让AI束手无策。早期的神经网络也只能做一些简单的线性回归，完全无法解决实际问题。

为什么后来AI能有这么大的进步呢？很多人把这些进步归功于大量的互联网数据和更强的算力，我不否认更多的数据和更强大的算力是AI进步的重要因素，但是我们也不能忽略这些为AI进步提供重要算法突破的科学家。这些帮助AI进步的算法其实总结起来就干了一件事：让AI的反馈循环变得更快和更有效。

在反向传播算法成熟之前，多层的人工神经网络是极难训练的，原因很简单：当你发现这个人工神经网络的预测结果和正确答案不一样的时候，你很难知道应该调整哪个层次的人工神经元连接权重。反向传播算法最大的贡献就是告诉训练人工神经网络的研究者应该如何逐层调整人工神经元的连接权重。卷积神经网络也是同样的思路，把人工视觉皮层分成多个层次的小块，这样一旦训练出现预测结果不准确的情况，只需要调整相关小块人工神经元的连接权重就可以了，不需要做全局的连接权重调整。

强化学习算法更是模仿人类的多巴胺等神经激素，用预测的结果来调整人工神经元的连接权重，这样就不用像蒙特卡洛算法一样必须要到出现最后结果才能调整神经元连接权重。无论是哪种方法，本质上都是提高反馈的效率和质量，把反馈循环做得更高效，更快。反馈循环更高效，更快有什么好处呢？

无论是人类智能还是人工智能，反馈训练越快速，越有效，就能越快越有效地从环境中获得自己行为结果的反馈，并且根据这个反馈的结果来重新调整内部的“模型”并做出改变。早期的人工智能之所以效果不好，要么从外部环境中得不到有效的反馈，要么是得到了反馈但是不知道该如何调整内部模型和下一步的计划。

现在的生成式AI通过反向传播等算法提高了根据训练数据来调整内部模型的效率，但是现在的生成式AI还不能做到持续地从外部环境的反馈中进行学习，一旦训练截止，AI的模型文件就不会再根据新的反馈更新人工神经元的连接权重。这是人类智能和人工智能目前最大的区别。

我们能够从AI的进步中获得什么借鉴呢？我相信最主要的借鉴就是在于如何让反馈循环变得更加可靠和有效，同时提高反馈循环的速度。我们现在的教育系统实际上还没有AI训练的反馈循环有效，我们之所以觉得AI能代替人，完全是因为人类教育中建立的学习反馈循环简直是弱爆了。

我们的教育无论是义务教育还是高等教育都是流水线式的，每个年龄段的孩子和同龄的孩子一起学同样的内容，交同样的作业，然后几个月后完成同样的考试。这种流水线的教育的结果就是可汗学院的创始人萨尔曼.可汗说的那种“瑞士奶酪式学习”。

什么是瑞士奶酪式学习呢？就是看似你的知识量每年都随着你的年龄增加，但是每个孩子对同样的教学内容有不同的理解程度。一些没能正确理解一些重要概念和技能的孩子就会在他的知识体系中留下一个洞。遗憾的是我们的教育并不能针对每个人的理解能力单独设置课程和考试，就造成这样的洞随着一个学生学习生涯的增长而不断增加，最后这个学生的知识体系就会变成一块瑞士奶酪，貌似知道了很多，但是到处都是漏洞，很多核心和基础的概念没有做到充分的理解。

我们的学生在学习过程中没有形成有效的反馈循环，有时候学生自己也不知道自己没掌握某个知识点，但是他们会在某次考试中遭遇这个知识盲点，然后莫名其妙的失败了。究其原因就在于反馈来的太晚了，并且反馈的效率也很低。

现在教育体制的另一个大问题在于重输入而轻输出。这个问题在这个移动互联网和AI发达的时代甚至有点儿要演变成全民病患的趋势。为什么生成式AI可以模拟人类的语言呢？因为人类大脑也是生成模型，只不过人类大脑生成的不仅是语言，还有对外部世界的模拟。所以输入和输出都是学习过程中的一部分。

现在的教育中强调学生要听讲和记笔记，学生的输出也是格式非常死板的作业，学生的输出更注重量而不是质，学生往往把更多的时间花在重复性地做同样的题型上。学生在学习中没有利用学到的知识来创造性地输出新内容的机会，老师对学生们创造性的输出往往更多的是忽视和打压，而不是惊喜的接受和鼓励。

这个问题不仅存在于教育系统中，还普遍存在于整个社会，大部分人只要一睁眼就会打开手机，然后一天的大部分闲暇中注意力都会被手机中的各种APP占用。这些手机APP都是往人脑中输入海量的信息，但是人在这些APP中输出往往是极度有限的，最多就是点击几个按钮，或是下意识的下滑窗口罢了。

我们需要明白人脑同样是一个生成模型，生成新的内容是人脑中非常重要的功能。现在每个人生活中输入信息量和输出信息量的严重失衡是现代社会大量心理问题的神经学基础。我们之所以觉得AI出来以后要替代人类不仅仅是因为AI太强了，而是人的学习能力现在越来越弱了，不是AI能代替人类做决策，而是人自身的输入信息和输出信息严重失衡了。

很多互联网上的文章天天讨论在AI时代应该掌握什么技能，我倒是认为在AI时代最重要的是加强人自身的主体性：（一）用更有效的反馈循环建立属于自己的知识体系。（二）加强输出，除了从互联网上获取信息之外还要持续产生自己的输出，让输出和输入的数据量保持一个合理和健康的比例。（三）逃离信息茧房，拥抱物理世界。不轻信任何信息源和AI工具，永远把自己作为和物理世界和复杂人类社会交互的主体，主动验证从各种各种信息源来的数据，拒绝成为被信息茧房操纵的提线木偶。