算了,问早了。
故事是这样的。
前两天晚上睡不着,刷短视频的时候看到一个特别有意思的视频。一个外卖小哥在送餐路上,用AI生成了一段rap歌词,边骑车边哼唱,最后还把自己的日常工作流程AI自动化了一下。
评论区有人问他:“你这是在工作还是在搞副业?”
小哥回复:“这不,不耽误工作吗。”
我当时就愣住了。不是因为小哥的rap有多好听,而是因为这种”既在工作,又在玩AI”的状态,太真实了。
你知道吗,我们老在讨论”AI什么时候会取代人类”,好像这个问题是个科幻命题,要么很远要么很近。但其实真正的替代,可能不是那种”机器人接管工厂”的宏大叙事,而是这种悄无声息、潜移默化的”无缝融合”。
就是。。你还在送外卖,但你同时也在用AI。AI还没有接管你的工作,但已经在接管你的思考和娱乐。
AI看不到的,我们一直在看
说到这个,我想起了一个特别经典的老梗——AI看不到爱心。
用AI生成表情符号的时候,AI生成的爱心永远是三个实体符号❤️❤️❤️,不会生成那种我们常见的”♡︎“(空心爱心)。原因是,空心爱心在电脑里不是一个标准emoji字符,它实际上是”♡“这个字符加上一个特殊的组合符号”︎“(Variation Selector-15),用来告诉系统”这个字符要用空心版本渲染”。
AI没见过这种组合,所以永远生成不出来。
这事儿很有意思,因为背后是AI和我们人类的一个本质区别:我们活在”流”里,AI活在”帧”里。
什么意思呢?人类看世界,是连续的,比如「♡︎」不是一个静止的字符,它是一个需要实时渲染的概念。人类能理解”空心爱心”的概念,然后用「♡」加「︎」的组合去表达它。这是动态的理解过程。
AI看世界,是基于训练数据的静态”帧”。它没见过「♡︎」这个组合,就认为这玩意不存在。
这么一想,我们老担心的”AI什么时候会取代人类”,本质上是在问:什么时候AI能从”帧世界”进化到”流世界”?
具体的替代,现实的替代
坦率的讲,现在AI能取代的,都是那些可以用”帧”来表达的工作。
比如写作。AI可以取代那种结构固定、范式明确的写作:新闻稿、财报分析、营销文案、代码注释。因为这些都属于”帧世界”——有固定模板,有可被学习的结构。
但AI目前还取代不了那种”流世界”的写作:卡兹克这样的公众号长文,一个活人用三年时间磨出来的写作风格,那种基于体感记忆的叙事节奏,那种在论述中故意打断自己的”呃,就是怎么说呢”的口语感。
为什么呢?因为这些写作的核心是”我不是在写一篇文章,我是在一件事情的情绪和节奏里流动”。
如果说写作还是抽象,我们再来看一个更具体的事情。
前几天有个朋友跟我说,他们公司用了AI工具来做客服质检。以前客服质检需要人工听录音,标记哪里有问题,然后输出改进建议。现在AI直接从语音转文字,然后生成质检报告。
效率提升了十倍。
但质检负责人跟我说了一个细节:AI做质检,几乎永远只能找出”标准流程问题”。比如客服没说标准话术,没确认客户信息,语气不好等等。但那些真正有价值的问题——客户为什么突然不高兴了,客服在那个瞬间有什么情绪波动,客户的潜台词是什么——AI根本看不出来。
AI能看到的,是流程”帧”。人类质检员能看到的,是情绪”流”。
所以你看,AI已经在取代某些人类工作,但它取代的是那些可以用”帧”来描述的部分。那些需要用”流”来感知的部分,暂时还不行。
流动的世界
顺着上面的再聊聊,我们这个世界,其实从来就不是”帧”构成的。
我小时候学编程,老师教我们画流程图。流程图里每一个节点都是一个帧:开始、输入、处理、输出、结束。看起来很清晰对吧?
但我自己的感受是,现实世界根本不是流程图。现实世界是”流”——无数个非线性、相互交织的决策路径,每一个决策都带着当时当下的情绪、环境、意外。
AI现在能理解的,就是流程图式的”帧”世界。因为训练数据就是一个个静止的帧:图片是像素帧,文字是字符帧,语音是波形帧。
但现实世界里,帧和流是同时存在的。
一个外卖小哥边骑车边用AI创作rap,这是”帧”(送外卖)和”流”(创作rap)的共存。 一个客服质检员用AI处理流程问题,但自己处理情绪问题,这也是”帧”和”流”的共存。
所以问”AI什么时候会取代人类”,我觉得。。问早了。
因为人类要被完全取代的前提,是AI能同时活在帧和流里。而现在的AI,还在帧世界里原地踏步。
替代已经开始,但不是全部
当然,我不是说AI没有在替代人类。它已经在替代了,而且替代得挺彻底。
比如写财报分析。以前财务分析师要花一整天时间读财报,提取关键数据,写分析报告。现在AI五分钟搞定。
但这种替代,不是”AI在替代分析师”,而是”AI在替代分析师工作中那些可以用帧描述的部分”。
剩下的那些”流”的部分——比如分析师要从财报里看出公司经营策略的变化,从现金流波动里预测未来风险,从同行对比里判断行业趋势——AI还不行。
因为这些都是”流”的感知:连续的信息变化、决策路径的非线性、未来的不确定。
这么说你可能觉得有点抽象,我换个例子。
很多人在用AI做翻译。AI翻译新闻稿、技术文档特别牛逼,因为这些都是”帧”文本:结构固定、词汇标准化。
但你让AI翻译一篇卡兹克的公众号文章,它就懵逼了。文章里的口语化停顿、故意打破节奏的句子、情绪化的标点、自嘲的语气,AI翻译出来会变成一堆僵硬的”帧”组合,完全失去了那种”一个活人在跟你聊天”的感觉。
翻译这个工作,一部分是”帧”(词汇转换),一部分是”流”(语气感知)。AI能替代的是前者,暂时替代不了后者。
三宫格折叠
回到那个外卖小哥的故事。我其实特别好奇,小哥在用AI创作rap的时候,脑子里在想什么?
他可能在想:送外卖是个工作,创作rap是个爱好。但这两个事情在他脑子里,不是割裂的两个”帧”,而是交织在一起的”流”。送外卖的路上看到什么风景,可能会变成rap的灵感;rap创作时的心情,可能会影响送外卖的状态。
这种交织,让他的生活不是”帧+帧”,而是”流+流”。
AI目前还理解不了这种交织,因为AI的训练数据都是割裂的帧:外卖数据是外卖帧,rap歌词是rap帧。两个帧之间没有”流”的连接。
但未来呢?
我自己的感受是,AI什么时候能从”帧”进化到”流”,取决于它什么时候能看到这种”交织”。
换句话说,AI什么时候能理解”北京折叠”——郝景芳科幻小说里的那种三宫格世界:最上层的人生活在奢华空间,中间层的人生活在中等空间,最底层的人生活在拥挤空间。三个空间折叠在一起,但不是割裂的帧,而是相互影响的流。
AI现在看到的,是三个割裂的帧。但如果我们生活在折叠世界里,AI要取代我们,就得看到三宫格之间的流动和交织。
这就有点像。。现在的AI,只能看到外卖小哥在送外卖(帧),看不到外卖小哥在用AI创作rap(流)。如果要完全取代小哥,AI就得同时看到帧和流,看到两者之间的交织。
未来什么时候到来
说真的,我也不知道AI什么时候才能真正理解”流”世界。
也许五年,也许十年,也许永远做不到。
但我自己的观察是,我们现在讨论的”AI取代人类”,其实都是在”帧”层面的讨论:取代流程性工作、取代标准化操作、取代重复性劳动。
而真正的”流”层面的取代——取代人类的创造力、情绪感知、非线性决策、交织生活——还没开始。
所以,别太担心自己被AI完全取代。
你担心的应该是,AI会取代你工作中那些可以用”帧”描述的部分。而剩下的”流”的部分,会成为你真正的价值。
换句话说,未来的分工可能是:AI负责”帧”,人类负责”流”。
外卖小哥送外卖(帧)可能有一天被AI取代,但小哥创作rap(流)永远不会。因为创作是流动的,是不可被帧化的。
客服质检员处理流程问题(帧)可能被AI取代,但处理情绪问题(流)永远不会。因为情绪是流动的,是不可被帧化的。
财务分析师写标准分析报告(帧)可能被AI取代,但从财报里看出经营策略变化(流)永远不会。因为策略变化是流动的,是不可被帧化的。
回到开头
我们老在问”AI什么时候会取代人类”,其实应该问的是:“AI什么时候会取代那些可以用帧描述的人类工作?”
而这个答案,可能已经很近了。
但我们更应该思考的是:“那些不能用帧描述的人类工作,什么时候会变得更重要?”
我觉得,就是现在。
外卖小哥在用AI创作rap,质检员在用AI处理流程问题,财务分析师在用AI写报告。但他们的价值,已经悄悄从”帧”转移到了”流”。
AI在接管帧,人类在接管流。
这样一想,我反而没那么焦虑了。因为我的工作里,有很多”流”的部分,AI暂时还理解不了。
你呢?
夜雨聆风