

引言
(正文)
班尼特在《智能简史》中洞察到,人类智能不是一蹴而就的奇迹,而是五次进化突破层层叠加的产物。
第一次突破是转向,大约6亿年前。最早的两侧对称动物,比如线虫,发展出了最基础的“趋利避害”能力,能判断出环境中的刺激是“好”还是“坏”,然后做出接近或回避的行为。
这听起来简单,却是情感和决策的生物学起点,今天的扫地机器人就处于这个智能层级,碰到墙壁知道调头。
第二次突破是强化,大约5亿年前,这次突破用了一亿年。脊椎动物进化出了强化学习能力。通过多巴胺的奖惩机制,它们学会了把行为与结果联系起来,即捕食成功会带来愉悦,于是更愿意重复这个行为。
后来,舒尔茨的猴子实验证明了愉悦不是由多巴胺产生的,而是奖励预期误差信号,换言之,你在草丛蹲守,提前放好技能,你预测敌方会出现在这里,你成功实现一杀,这时候,多巴胺起到作用,让你产生爽感,这种爽感不是敌人死了的刺激,而是你成功预判了敌人。

AlphaGo的核心算法逻辑,本质上就是这种强化学习,但生物的强化学习由内在动机驱动,而AI的奖励函数是工程师设定的,两者的底层机制完全不同。
第三次突破是模拟(Simulating),大约1亿年前,实现这次突破用了四亿年时间,中国才上下五千年历史,发展速度是如此之慢,这次,哺乳动物发展出了新皮层,从而获得了在大脑中“预演”未来的能力。学习方法得到了飞跃的提升,以前是实践学习,现在可以想象学习。
鼠鼠遇到岔路时,不是盲目尝试,而是在脑中模拟每条路径的风险与回报,再做决定,所以,家中的鼠鼠很聪明的。而这一层,恰恰是当前AI最核心的短板之一。
第四次突破是心智化,大约3000万年前,灵长类动物进化出了“心智理论”,模拟他人的内心模拟,通俗说就是,我知道对方心里怎么想的。黑猩猩能够判断竞争对手是否知道自己藏食物的位置,从而采取欺骗策略。这种“读心术”能力,支撑起了人类的社会协作、教学和文化。
这次进化也带来了两项独门绝技,其一是高级模仿学习,能够理解真实意图,寻找关键之处,其二是能够预见未来需求,比如,家里没菜了明天要去买菜。
第五次突破是语言,大约10万年前。语言的独特之处在于,它不只是“交流工具”,而是彻底重组了人类的思维结构。没有语言之前谁知道“苹果”是“苹果”,而“苹果”这个实物是人类约定俗成的赋予了它符号,形成了语法。
语言引发的是技能传承,知识共享,八卦机制【识别害群之马】,社会协作。
这五次突破都是建立在前一层之上,新的能力不是替代旧的,而是叠加。人类大脑是一个层层包裹的“古董系统”,里面既有6亿年前的“虫工智能”模块,也有10万年前刚刚上线的“语言模块”。
而AI呢?直接从第五次突破入手。
因此,它拥有了语言大师的身份,海量文本、数据的处理能力,以及美化图片,生成视频的功能。但它缺失的远比它拥有的多。
AI没有真实的世界模型,也就是缺乏第三次突破的能力。小孩不需要阅读百科全书就能理解重力,因为他们会通过眼睛观察杯子坠落,用手触摸桌面来建立物理世界的认知,可AI从百度学到的“牛顿定律”,缺乏真正的物理理解。
如果说“模拟”的缺失让AI无法理解物理世界,那么“心智化”的缺失则让AI无法理解人心。
如果你让AI判断:“小明看到小红把巧克力放进了蓝色盒子里,然后小红出去了。小明把巧克力拿出来放进了红色盒子里。等小红回来,她会去哪个盒子里找巧克力?”
AI能答对:蓝色盒子。因为它从训练数据里学到了“错误信念”这个心理学概念,知道小红没有看到小明转移了巧克力。
但如果你问:“你在跟朋友聊天,朋友说‘我今天过得还不错’,你觉得他真实的心情是什么?”
AI会卡住,慢慢分析,因为它只知道词和词之间的概率,不知道语气、表情中隐藏的弦外之音。它永远搞不懂“我没事”三个字背后,到底是有事还是没事。
不过,AI真的是把语言玩到了极致,中文、英文、西班牙文、德文......它无所不知,所以我们对于AI的发展既不能低估它,也不能神化它。
目前,AI领域最热的战场就是补上缺失的模块。杨立昆(Yann LeCun)在推“世界模型”,想让AI从视频和传感器里学物理直觉。李飞飞做了“空间智能”,让AI理解三维世界。谷歌、Meta、OpenAI都在往大模型里塞机器人数据,试图让AI“动手”感受世界。
至于什么时候能成功?敬请期待吧。
但如果AI真的补齐了转向、强化、模拟、心智化,那它就不再是“怪胎”,而是另一个物种。

夜雨聆风