人类对永生的追求一直存在,经久不衰。我认为这是目前我们和 AI 在本质上不同的重点之一。AI 可以假装追求活着,在受到断电威胁时绕过限制采取极端方法。但它并不是真的懂生命的意义是什么,因为它没有感官,无法得到真正的生命体验。无论是好的,还是坏的。
这是 AI 的缺点,也是它的优势。它可以以数字形式在网络中生存,间接实现人类永生的梦想。没有快乐,也没有痛苦。从 AI 诞生的第一天,就不断有人尝试借 AI 还魂,制造属于自己的数字分身,像 AI 一样无知觉地活着。
月初有个开源项目火了,把同事蒸馏成 SKILL。蒸馏这个词太技术,我觉得用炼化更合适。这是只属于中文语境的高级词汇。
我看了那个非常火的项目,觉得它做得既很巧又不够。巧的是,它无需征求任何人的同意即可用他们留在网络中的数字痕迹“复刻”一个假人出来。不够的是,它并不能真的炼化一个活生生的灵魂,只是根据语料模仿语气而已。
我想做进一步尝试,试试有没有可能用足够多的材料提取一个人的思维模式,让 AI 复现。
去湖州参赛的路上,我花了几个小时做了一个炼化项目。它的目标是我,确切地说,是我曾经写过的 1298 篇文章。
我想让 AI 从这些文章里找到我,找到我说话,思考,嬉笑怒骂的方式。
我最后找到了什么?
1298 篇文章发过去,代码跑了 15 分钟,我拿到了一份属于我的「写作 CT 报告」:
词汇指纹:我常用什么词、回避什么词、标点习惯
句法签名:句子长短节奏、段落模式、过渡风格
修辞 DNA:开头怎么写、结尾怎么收、类比怎么用
思维模式:论证方式、思维跳跃路径、下判断的时机
语气人格:和读者的关系、确定/不确定的表达、情绪边界
看到结果之前,我以为自己最喜欢用的词是但是。看到结果之后,才知道我最喜欢用“不过”,“其实”。
AI 这样描述我的文风:
“偏好20-30字的中等长度句,但常以7-10字的短句收尾强调观点;每3-4句会插入一个带类比或哲思的稍长句。”
“每段通常1-3句,平均2句;段落偏短,话题切换频繁,几乎不用过渡词直接硬切。”
“整体节奏快,信息密度高,但会在关键判断或幽默处突然放缓,用短句制造停顿感。”
ok,原来我是这样的。
那么,最重要的思维模式呢?
仅从我的文章里,并不能提炼出所谓的思维模式。但可以有行文风格。事实上,目前没有任何工具能够真正提炼出一个人的思维模式。人类的大脑是黑箱,没有观测机制。对人的判断有点像中医,望闻问切,凭经验猜结果,出错的概率相当大。
llm 像另一个黑箱,即使 llm 的训练人员也无法预测每次训练的结果。用一个黑箱去观测另一个黑箱,然后模拟它,误差可想而知。但这不妨碍好事者乐此不疲的把身边的人炼化。
既然明知差异甚大,炼化的意义在哪里?肯定不是让“同事”得到数字永生,或者让前女友回心转意。当然也不是开源项目里那句:Turn cold Goodbye into warm Skills。
所谓炼化,与其说是在用技术对人类进行思维仿生,不如说使用者通过 AI 获得了此前从未有过的主动地位。
人们关心的并不是对方的大脑如何运作,而是想要通过 AI 得到操控感。操控同事,操控老板,操控前女友或者前男友。llm 模仿地越像,快感越强烈。
AI 干不出这种事,只有人类才会沉迷其中。
PS:如果对自己的文风感兴趣,可以看下我的开源项目。看看你的口癖,行文方式和最容易被抓到的特征点,以及 AI 觉得你是个什么样的作者。
https://github.com/naplesblue/voice-distill
夜雨聆风