全文5549字
今天和大家聊一聊大脑、编程和AI。
这篇文章有点长,我从一个特殊的系统性视角来看待它们。希望对大家有帮助。
在文章的开头,我先抛出一个问题,表征的定义是什么?
表征可以说是一种映射,就是一种物品可以被另一种物品或者信息表示。这里我举一个最常见的例子。人的大脑其实也是对世界的一种表征。大脑里存储着一个物体的视觉信息、听觉信息,甚至是语言信息。这些不同的信息都可以是对物品的表征。比如苹果,苹果本身是一个客观的物理实体,它可以用“苹果”这两个字表示,也可以用视觉信息表示。其实这些表征,本质上最后都要落到大脑里的神经脉冲信号上。这样看来,这些记忆本质上也是一种物理现象。所以说,这个世界上,其实就是用一套物理规律来表征另一套物理规律,或者说是一种映射。
那为什么会出现这样的状况?这就要问问基因了。其实基因本身也是一个物理实体,无论是DNA还是RNA。正因为基因有复制的逻辑,才使得上面的表征有了意义,否则上面的表征都只是无意义的客观现实。我们的大脑正是通过神经脉冲的信号,去表征哪些物品有价值,哪些动作可以做,哪些人值得追,哪些环境有危险。也就是说,表征之所以重要,不只是因为它存在,而是因为它对生存和行动有意义。
讲到这里,其实AI也是一样的。它也需要一个东西或者物理机制来表征世界。这个表征就是数学形式,就是向量、矩阵、方程。直白一点说,这些数学语言最后也要通过半导体的电流来表征,也就是0和1的表征。所以它本质上仍然是一种物理逻辑,也仍然是对世界的一种表征。并且这种表征还可以和人的自然语言表征相互转译,所以我们才可以和AI进行文字交流、语音交流。
其实在AI出现之前,还有一种重要的表征,那就是编程语言。编程语言同样可以对世界进行表征。这样看来,程序员其实就是学了一门新的语言。但这里的“语言”不是普通意义上的说话工具,而是一种能够接上外部能量杠杆、并且可以直接执行的表征语言。也就是说,程序员之所以重要,不只是因为他会写代码,而是因为他可以把人的目的、规则、流程,转译成机器可以执行的外部物理逻辑。
但为什么人们需要不断创造出新的表征形式来表征世界呢?其实有一点很关键,就是这些表征一旦接上了能量杠杆,就有了更大的力量。大家注意到没有,其实上面说的表征,本质上就是信息。信息是客观事实的载体,而信息一旦能够被处理、被调用、被外包,它就不只是信息了,它会变成一种生产力。
说到这里,我觉得有必要再回去讨论一下人本身。如果没有基因,那就没有生物;没有生物,客观现实就只是客观现实,它本身不会自动带有“有用”或者“没用”的意义。所以说,正是因为有了基因,很多物理现象才对生物有了意义。
那么对于人来说,他在起初本身就是一个基因的复制体,需要获得能量。他为了获取能量,还要不断消耗能量。比如捕猎,猎物具备能量,人需要运动和思考来得到猎物。所以说,人本来就是一个经济体,需要衡量成本和收益。如果捕猎后得到的净能量是正的,那就可以活下去;如果净能量是负的,那就会死掉。也就是说,在最原始的阶段,人就在做一种成本收益计算。
因为这个目的,人才需要去获取信息,去了解环境,所以才需要一套机制来表征环境。这个机制就是神经脉冲,或者说脑子。脑子里存储了环境的信息,这里的环境也包括人的社交信息。这个表征系统要让人们记住,哪些食物热量高,哪些地方有危险,如何获取食物,如何和朋友共处,如何择偶。注意,我这里说的人,更多是指我们的原始祖先,但现代人的大脑,本质上还是从这个系统一路延续下来的。
但有一个事实,我们现代人的生活,是从原始时代一步一步改善过来的,这个过程是必须存在的。从史前时代、古代到现代,从吃不饱到温饱再到富足,这意味着什么?这意味着人们获取的能量越来越多,寿命越来越长,人口越来越多。其实,这离不开生产力的提升。人们能获取越来越多的能量,意味着人们能利用到越来越强的能量杠杆。
从牲畜,到蒸汽机,到信息技术,再到AI,这其实是一条线。牲畜和蒸汽机是对物理能量的放大,信息技术和AI则是对信息处理能力的放大。而信息技术的基础,不就是编程语言吗?编程语言是什么?它也是对世界的一种新的表征。只不过,这种表征一旦接上半导体,就能利用很强的外部能量杠杆去处理信息。
回到刚才的论述。我说,人本来就是一个经济体。过去食物不充足的时候,人以获取正的净能量为目的,也就是:净能量=捕猎到的能量-因捕猎消耗的能量。那么到现在,食物充足了,人仍然是一个经济体,只不过他的目的变成了获取利益或者价值,也就是:利润=获得的价值-付出的成本。
这时候有一点非常重要,就是现在的人和过去的人,用的本质上还是同一套大脑,还是同一套神经脉冲和记忆机制来表征世界,并且都靠这套机制处理信息。也就是说,我们其实一直都在用同一种表征系统,去理解能量、理解价值、理解成本、理解收益。只不过,现代社会把原始的能量问题,进一步抽象成了更复杂的利益问题而已。
所以,人为什么会不断创造新的工具、新的制度、新的技术?因为在人性里,人们都想用最小的成本来获得最多的利益,或者说遇到难问题时就会退缩,因为他觉得这会付出很多成本,并且会恐惧。其实仔细想一下,你的大脑在思考时也会消耗能量的,这是由你吃的食物补充的,这意味着成本。人们更喜欢不付出太多精力就容易获得利益,这就像原始人看到最近的食物就抓紧吃掉没有区别。所以用最小成本付出获得最大利益是更受欢迎的。正因如此,任何能让人实现这一点的都技术都受欢迎,因为它把人的成本(尤其是认知成本)消耗降低了,所以说,人们利用能量杠杆的能力越来越强。
大家仔细想一想,降低一个人获得到某个价值的成本,或者说让人时刻保持认知轻松,不正是商业的其中一个本质吗?比如短视频,让食物的保质期更长的电冰箱等等。
所以说,商业和技术,其实是连在一起的。技术之所以重要,不只是因为它先进,而是因为它能把某种价值更低成本地送到人面前。商业之所以成立,也不只是因为它卖东西,而是因为它组织了一套更低成本的价值获取方式。
这也引出了一个我觉得非常关键的东西:认知成本。所谓成本,不只是钱,也包括时间、精力、注意力。后两项是认知成本,它意味着人要对自己存储的记忆信息,以及外部输入的信息,进行处理、加工、比较和选择。这一步是很费脑的。
所以说,如果能用一种别的信息表征,来帮助人处理这些信息,那不就是在降低人的认知成本吗?在技术支持的前提下,编程就出现了。人们可以把自然语言转译成编程语言,然后通过半导体这个能量杠杆,去处理信息。这样来看,编程就是一种语言,或者说是一种搭载信息、处理信息的信息框架。我们前面说程序员只是学了一门新的语言,为什么在AI出现之前程序员这么受欢迎?因为程序员是直接利用能量杠杆的人,或者说,他能把人的外部目标和信息,转译成半导体电流可以执行的表征。
AI本质上也是处理信息。它通过数学形式对世界进行表征,但这个数学表征最后同样需要半导体的物理电流来承载。AI也可以和人进行信息传递,不过双方都是对同一种客观事实进行表征,只不过表征的形式不同。一个更接近自然语言,一个更接近数学形式。而AI也拥有比人脑更强的能量杠杆,想象一下,人脑有限的工作记忆,和AI能够调用的大规模上下文与数据记忆之间,处理信息的能力本身就存在差异。
所以,AI可以让人付出更小的成本,不只是钱上的成本,也包括时间成本、行动成本和试错成本,从而得到更有效的外部信息,帮助自己获得价值。比如你可以花不到1000元去做一次尝试型创业,即便失败了,你也可能获得经验,这同样是一种价值。也就是说,AI降低的,不只是一个动作的执行成本,它还降低了很多以前很难接近的生产资料的使用门槛。
但这里还有一点要考虑。如果你只是用AI做简单的表征转换,也就是把AI已有的知识信息转译成自然语言,再返回给你,或者说你只是把AI当成一个对话式工具,那它的能量杠杆还没有被充分利用。因为AI不只是能表征自然语言,它也能表征编程语言,或者说,它可以先把自然语言转译成它内部的数学语言,再进一步转译成编程语言。这样一来,能量杠杆还能再提高一层。
其实关于客观信息的表征形式,本身不是最重要的,重要的是我们能不能掌握这些客观信息,并且能不能把这些信息接到更强的能量杠杆上。在AI出现之前,把客观信息以自然语言的形式转译成编程语言,本身就是一种高成本任务,但现在AI可以承担其中相当大的一部分。这样的话,人们获取能量杠杆的成本就进一步降低了。这意味着效率提高又近了一步,或者说,人们更容易拿到高级生产资料了,从而帮助自己更有效率地获得价值。
也正因为如此,如果说软件的本质是编程语言,那么当AI可以进行编程的时候,写软件这件事本身就不会再像以前那样稀缺。这并不意味着软件会快速减少,这里还存在一个信息传递延时,也就是认知差,很多人的习惯、组织方式、市场结构不会立刻改变。但我觉得,未来会出现软件的分化。几个巨头软件,尤其是和社交、关系链、流量入口有关的软件,还会继续存在;但大量门槛并不高、只是完成局部信息转译的小软件,可能会被挤压,甚至消失。
如果再进一步看,人和AI、AI和编程之间的具体交互,本质上也是表征的连续变换。人的目标、经验、判断,先在大脑里以记忆的形式存在,然后被转译成自然语言;自然语言再被AI转译成数学形式的表征;而这些数学表征,还需要结合AI已有的数据记忆去解码、理解,最后再进一步转译成文字、方案,甚至是编程语言和可执行的软件结构。
这里面最重要的问题,其实不是AI会不会说话,而是信息在表征变换的过程中会不会失帧。因为人脑中的记忆表征,和AI内部的数学表征,并不是天然完全对应的。很多时候,人说出来的只是自己脑中想法的一部分,但人会默认对方已经理解了剩下的部分。尤其是面对抽象词、模糊目标、默认背景、隐含约束的时候,这种错位会更明显。人以为自己表达得很清楚了,但AI实际接收到的,只是被压缩过的一段自然语言,它只能根据自己的数据记忆去补全,而这种补全未必就是人真正想要的东西。
所以,宏观上看,人和AI的主要交互问题,仍然是沟通问题,只不过这是两种不同表征系统之间的沟通。自然语言本来就不是完全透明的,它会省略,会模糊,会依赖说话者默认的语境。而人本身又有快思考的倾向,总想用更低的认知成本完成表达,于是就更容易出现信息遗漏、概念混杂、目标不清的问题。也就是说,很多时候并不是AI不能理解,而是人的表征在转成自然语言之前,就已经发生了压缩和失真。
正因如此,在与AI交互时,一个很重要的原则就是信息透明化。目标要透明,背景要透明,限制条件要透明,评价标准也要透明。不要让AI去盲猜,不要把关键约束只留在自己的脑子里。因为一旦人没有把这些信息外化出来,AI就只能按它自己的统计规律去补全。而补全越多,偏差就可能越大。最后看上去好像是AI出了问题,但很多时候,真正的问题出在最开始那一步:人没有把自己的记忆表征清楚地转译为自然语言。
这一点到了编程上会更加明显。因为AI把数学表征进一步转成编程语言时,表面上是在写代码,实际上是在替人把目标转成一种可执行的外部逻辑。可执行,不等于正确;能运行,不等于符合目标;代码写出来,也不等于利润就出现了。AI只是一个杠杆,它是一种生产资料,它能够降低人把目标转成外部执行结构的成本,但它不能替人决定什么目标值得做,也不能替人承担做错之后的代价。人仍然是最后的经济体,仍然要考虑收益、成本、风险,以及结果是否真的符合自己的利益点。
所以说,提问和下指令这件事,本身并不是一个简单的话术问题,而是一个认知问题。因为指令来自人的自然语言,而自然语言又来自人的记忆表征。如果一个人的认知本身就是混乱的,他对目标没有形成清晰的内部表征,那么他给AI的指令大概率也会是混乱的。这样一来,AI再强,也只是在放大一个模糊的目标。它确实降低了执行成本,但前提是人先要承担形成目标、澄清问题、判断结果的认知成本。
这样看来,AI更多是在放大一个人的能力。它虽然在信息处理的形式上,和人脑有某种相似性,都是通过内部表征去处理外部世界的信息,但它终究不是人。它没有基因意义上的生存目标,没有天然的价值判断,没有情绪上的趋利避害,也没有人那种对成本、风险、收益的切身感受。所以说,AI本质上仍然只是一个杠杆,而且是一个信息处理能力极强的杠杆。
正因为如此,AI可以帮助人处理信息、转译信息、生成信息,甚至替人完成一部分原本需要认知劳动的工作,它可以给出答案,可以生成代码,可以提供方案,但这些东西本身并不自动等于人的利益。利益这件事,最后还是要回到人自身,因为人仍然是最终承担成本、获得收益、承受风险的那个经济体。
所以,人在使用AI的时候,不能因为它降低了成本,就误以为它替代了人的判断。恰恰相反,AI越强,人越要清楚自己的目标是什么,自己到底想获得什么价值,自己能承受什么代价。因为AI放大的,不只是人的能力,也会放大人的模糊、偷懒和错误。如果一个人的目标本身就不清楚,那么AI只会更高效地把这种不清楚扩展出去;如果一个人的判断本身就有偏差,那么AI也可能把这种偏差包装得更完整、更像正确答案。
这一步很难,也很花时间,但这一步不能省。因为AI能够替人节省很多成本,却不能替人跳过认知本身。人如果不愿意在前面花成本把目标想清楚、说清楚、验清楚,那么这些成本并不会消失,它们只会在后面以误解、返工、偏差和错误决策的形式重新出现。这样来看,人和AI协作的关键,并不只是会不会用AI,而是能不能让自己的目标,在多次表征变换之后,仍然尽可能准确地落到结果上。
如果按这个逻辑继续往下推,那么未来人与AI之间真正拉开差距的地方,可能不只是技术使用能力,而是一个人的认知能力、判断能力和定义目标的能力。因为AI可以越来越便宜地提供答案,但“问什么”“为什么问”“什么答案值得采纳”,这些问题,依然要由人自己承担。
好了,以上就是我的观点。
欢迎大家在评论区分享自己的看法。
如果对大家有启发,可以点赞,收藏,转发。
关注我,我会持续分享认知思考。
夜雨聆风