AI时代,最好的专业是什么?黄仁勋在今年3月份的一个播客里给出一个答案,英语文学,English Major。
为什么呢?黄仁勋的逻辑是,语言将是AI的终极编程语言,而英语文学,就是掌握这种终极编程语言的技术。
更深的话,黄仁勋没有展开说,但我深以为然,他说这句话的时候,一下子把我脑子里萦绕很久的坚冰砸开了。
因为我曾经看过杰弗里·辛顿的一个演讲,辛顿是2024年诺贝尔物理学奖得主,被视为AI教父,他在这个演讲里提到AI为什么比我们聪明,可以消灭人类,那么AI为什么比人类聪明?
因为AI可能更触及语言的本质,人类在AI方向上曾经有两种选择,一种是,冯诺依曼和图灵路线,这就是生物路线,他们把智能视为神经网络,关键是学习连接强度。
由于俩人英年早逝和各种原因,早期的AI研究其实偏向了另一个路线,符号路线,这一派的路线认为,智能就是逻辑推理,知识用符号表达,思考就是操作符号,这长期以来是AI研究的主流。
辛顿就是带着人类走出符号路线死胡同的那个人,他重新带着AI走向了生物路线,符号主义认为语言是翻译,从自然语言翻译成一种无歧义的内部语言。辛顿完全推翻了这种观点,他认为,语言是一种向量,语言真正的类比是蛋白质折叠:一串氨基酸,有些部分互相吸引,有些互相排斥,你要在键角约束下把它折成三维结构,让喜欢的部分靠近、讨厌的部分远离。
理解句子也是如此——把词的特征向量调整到互相兼容的状态。
我们目前的所有大模型都是基于辛顿的理论,这些AI就是像他说的那样理解语言,说人话,就是,AI对语言的理解是拼乐高,按照乐高块的架构把乐高拼起来,就产生了各种乐高模型,每一个词word就是一个乐高块,把这些word连接起来,就是一个句子。只不过,语言这个乐高模型,要比乐高块复杂得多,一个乐高块,只有几个自由度,但一个word就是几千个自由度。
理解了辛顿对语言的理解,我们来说回黄仁勋的答案。
大模型做了一件事:学习人类语言的排列方式。 AI所做的,就是把自然语言,词与词之间的连接,按照指示,像乐高一样拼起来。
辛顿说了,语言是一种向量,那你知道最厉害的人是谁吗?就是能够找到乐高,并把那块乐高的方向和键角找对,放到拼图里的人。
而英语文学专业,他们的日常学习是什么?他们做的事情有点像我们的阅读理解,就是反复的阅读经典文本,并把每一个词语做word choice,为什么是这个词,而不是那一个词,大师们为啥要用这个词。
也就是说,就是张雪峰认为的最不值钱,最没有出息的文科生,还是文科里最无用的专业,可能在未来掌握了最先进的生产工具。
你问我相信张雪峰还是黄仁勋,我选择相信黄仁勋,因为他至少活到了63岁。
还有几个问题:
1、为什么是英语文学专业,而不是汉语言文学专业?
阿里研究院有一个《大模型训练数据白皮书》给过一个数据,全球网站英文占比59.8%,中文仅1.3%,从语料上,英文有天然的优势,全球互联网,经过质量过滤后,中文token仅有1%左右,汉语言文学在中文大模型训练方面可能有优势,但是基于英文的AI可能更容易涌现新范式。
2、为啥是文字而不是绘图或者别的?
因为文字才是AI的源代码,是AI时代的元知识,人最核心的能力,不是编程,而是精准、富有创造力的语言表达能力。而这项能力,正是英美文学专业训练的核心,或者说这才是真正的编程。
最后我想说的是,一度沸腾的龙虾热,现在已经凉下来了。这几年的AI热潮像极了当年的移动互联网热潮,当时很多人也在跟风学Java,注册下载各种app,上人人网,玩知乎,我当时玩人人网,几乎是当年班里最后一个,玩知乎,更晚一些,但是,我见过很多人,在那场移动互联网热潮中,不过是有了几个粉丝,约了几次炮,发了几次朋友圈,秀了几次优越。
我虽然是一个理科生,但是那时候,我已经开始意识到的语言的伟力,我开始敏感的意识到,精准的使用语言,是一种非常重要的能力,当然,我并没有辛顿的远见和黄仁勋的敏锐,但即使如此也让我享受到了一些时代红利。
那场互联网热潮中,真正坚持下来的,反而是我这种真正热爱文字,对语言的追求,涤荡的始终是浮躁的游来荡去的那波聪明人,AI又是一场浪潮,而且注定是一场更深度的涤荡,我经常说,所有的专业都玩了,最后人类剩下的是什么?我想最后剩下的,是语言、数学这些元知识,和掌握元知识的你我。
夜雨聆风