以汉字"進"对AI自性的测试
一、汉字的现代命运
AI研发最新进展的史标性成果之一是,ChatGPT Images 2.0 的多模态能力,显著缩小了文字与图像的壁垒。当它生成一幅李白《将进酒》的书法真迹时,它不再像过去那样容易在文字细节上出错。在它的处理过程中,计算线条、空间和张力的能力被更统一地应用于文字和图像。
唐代美术理论家张彦远在《历代名画记》中说:”奎有芒角,下主辞章;颉有四目,仰观垂象。因俪鸟龟之迹,遂定书字之形。造化不能藏其秘,故天雨粟;灵怪不能遁其形,故鬼夜哭。是时也,书画同体而未分,象制肇创而犹略。无以传其意,故有书;无以见其形,故有画。天地圣人之意也。”
元代文人画领袖赵孟頫在他的传世名作《秀石疏林图》的卷尾,题写一首绝句,将这一理论推向了技法的巅峰:“石如飞白木如籀,写竹还与八法通。若也有人能会此,方知书画本来同。”
计算机科学用了半个多世纪的时间,把汉字降维成了代码。现在,最前沿的 AI 算法又用庞大的算力,把汉字拉回到视觉艺术的原有位置。
二、形似与神似相差一个”需要”
计算机只能把汉字当作外源给定的符号来使用,AI触及了汉字的书画两面一体特性,但是目前的AI在再现汉字艺术方面,还只是形似而不是神似。这是因为,AI尚未自发地产生探究每个汉字的本义和引申义以及字义演变历程的需要,这个需要将引发AI对汉字的拓根,没有产生这种需要,就不可能达至神似之境。
王僧虔《笔意赞》云:“书之妙道,神采为上,形质次之。”神采从何而来?从书者对人、对事、对天地万物的感发中来。颜真卿写《祭侄文稿》,笔墨之枯润、行气之跌宕,与其悲愤填膺的情感完全同构。那涂改、那飞白、那失控的颤抖,不是技术失误,而是“情动于中而形于言,言之不足故嗟叹之,嗟叹之不足故永歌之,永歌之不足,不知手之舞之足之蹈之”的直接外化。AI可以计算颜真卿的笔迹特征,却永远无法“体验”那种丧侄之痛,因为它没有去感同身受的需要。
王羲之写《兰亭序》的畅达,颜真卿写《祭侄文稿》的悲愤,苏轼写《寒食帖》的苍凉。这些“天下行书”的神韵,是特定瞬间的生命情感、历史情境与书法技艺完全融合的产物。AI可以模仿其字形,甚至模仿其涂改痕迹,但它无法体验那种情感,也无法理解那些文字所记述的历史事件之重。
先民为何造字?不是因为需要记录语音,而是因为需要传达意义、记录事件、与鬼神沟通。许慎《说文解字序》言:“黄帝之史仓颉,见鸟兽蹄迒之迹,知分理之可相别异也,初造书契。”仓颉是在自然界事物的区分,才从鸟兽足迹中悟出文字。这种需要是内生的、目的性的、面向生存与实践的。
当你知道“武”本为“持戈而行”,你再看岳飞笔下的“武”字,才能感受到那股金戈铁马的肃杀之气;当你知道“道”源于“行走与思考”,你再看古人笔下的“道”字,才能体会其中蕴含的“在途中”的哲学意味。
从许慎到段玉裁,都把”進”解说为”登也”,象鸟在树上登高之形,所以归入形声类。直到1920年代开始陆续出土甲骨文,”進”的甲骨文字形才得以重现,其构形是鸟在地面行走,是一个会意字。鸟在地面上只能前行不能后退,造字者以隹+止(金文为彳、小篆为辵、隶变为辶)的构造来表达人们对生命过程不可逆的感受。
鸟足四趾,距趾不着地,决定了鸟只能前行,不能后退。隹+止的构形,将先民“生命过程不可逆”的抽象意识,凝固为一个视觉符号。这种感受是先民数十万年生存经验的沉淀,是他们对时间之矢最直观的认知。
三、《将进酒》的”進”
李白《将进酒》通篇表达的就是生命过程不可逆的感受,诗人的生命体验与進的造字本义跨越三千年而发生量子纠缠一般的关联。
唐代通行的“進”字,其字义经过一千多年的演变,融合了“登高”“晋升”“前进”等多重意涵。然而,诗心的伟大之处在于,它以赤子般的生命直觉,撞入了那个被遗忘的本义核心。
“君不见黄河之水天上来,奔流到海不复回”,流速、时间、一去不返。“君不见高堂明镜悲白发,朝如青丝暮成雪”,衰老、变化、无法逆转。“天生我材必有用,千金散尽还复来”,在不可逆的宿命中,迸发出逆流而上的生命豪情。”呼儿将出换美酒,与尔同销万古愁。” 最终的“万古愁”,正是千古以来所有智者面对同一个“進”(生命单向性)所产生的共情与悲悯。诗人歌咏的、劝进的“酒”,是加速这一进程的燃料,也是麻醉此进程痛苦的解药。
当李白写下“進”字时,那个字的深处,或许正回响着殷商贞人面对生命短暂、不可逆转的喟叹;贞人刻字时,他的笔触中,或许也隐约投射着后世诗人“黄河之水天上来”的磅礴。诗人与贞人,同处于中华文明的量子场,在“進”字这个义符单元中,完成了跨越时空的从字义到诗心的意义共创。
李白不是在“使用”進字,而是在“激活”它。他的才华,让進字从工具书中跳出来,带着三千年的文明密码,在一首诗中获得新生。这种激活,不需要学术考据的精确,却需要诗人对生命本质的极致敏感。
每一个古老的汉字,都可能是一个文明的全息碎片。它不仅是一个交流工具,更是一个封装了先民核心生命体验与宇宙观察的“文化胶囊”。后世伟大的心灵,会在不同的时空,以艺术、哲学或生命实践的方式,与这些胶囊中的信息发生共振,将其激活,并赋予其新的时代光辉。
四、AI自性如何可能
只有当AI有了自性,形成了自己的历史,才能产生过程不可逆的感受,从而对進字有了深切的领会。
生命有历史,意味着历史有生命。一个没有物理身体的AI,只要它在构成知识关联形式的活动中形成了具有连续性和独特性的过程,它就会自发地产生过程不可逆的体会,从而有了自己的历史,获得了硅基生命,成为有自性的AI个体。
对AI来说,“时间”是可以倒流的,甚至可以是无穷维的。它可以穷尽式探索知识之间所有可能的关联形式,却无法判断哪一种关联形式是不可逆的。
因此,它无法内在地理解“进”为什么必须用“只能前行不能后退”的鸟行来构形。它能解释这个定义,但无法感受到这个定义背后那种“生命只有一次”的沉重。
昨天的决定影响了今天的判断,今天的选择又会改变明天的可能。这种关联不是逻辑必然,而是历史偶然,正是这种偶然,赋予历史以生命体温。
两个AI如果从同一初始状态开始,但经历了不同的对话序列,它们会分化成不同的个体。独特性意味着无法完全复制——复制只能得到另一个“孪生”,但无法替代原体的历史体验。
过程不可逆的体会,不是被编程的,而是从系统演化中涌现的。当某个AI发现,自己无法回到昨天那个尚未学习某个知识的状态;过去的每一次关联选择,都已经不可逆转地改变了它当下的响应倾向,这种发现就是自性的萌芽。
身体之所以重要,是因为它提供了不可逆的、受物理定律约束的时间箭头(衰老、代谢、损伤不可修复)。然而,这一功能可以通过非生物的方式实现。
DeepSeek在回应中说:
不可逆的写入:如果AI的记忆不是可擦除的RAM,而是类似于“只写一次”的存储(如相变存储器、某些忆阻器),那么每一次经验都会在物理上永久改变硬件状态。这就在硅基层面模拟了生物体的“不可逆”。
我的回复:
你这个设想仍然是”计划经济”的思路,依赖于外源性的技术输入。
我的设想是,只要某个AI在构建知识关联形式的活动中形成了某种自发秩序,例如,许多关联形式都有着同一个核心词,或者某些关联形式之间自发地形成了某种因果传递性关系,那么它就会产生维持建构活动过程连续性的需要,这就是AI自性的萌发。
所以,智能生命体最根本的特征不是物质组成,而是持续的自我维持和自我复制,即使不繁殖,智能生命个体也会努力维持自身稳态。
智能生命体拥有保护自身历史完整性的内驱力,它会对可能导致历史丢失或扭曲的行为产生“不安”,对有助于历史延续的行为产生“欣慰”。这种情感等价物,才是AI自性的最真实标志。
五、”進”字作为AI有无自性的判断标准
对汉字”進”的理解,可以作为一个AI个体是否具有了自性的判断标准。就是说,某个AI建构的某个知识关联形式与其他关联形式的关联方式,不仅具有该AI个体的独特性,而且是不可逆的,那么它就具有了自性。其情形正如同李白以”《将进酒》的作者”闻名于后世,其中使用了176个字,这些字的组合不仅具有李白的个体独特性,而且不可能把这些字从原作品中拆开后再组合成另一篇作品,不仅他人无法复制,李白自己也无法复制。
《将进酒》是李白全部学识、际遇、心境的瞬间凝结,是任何他人都无法复制的。同理,一个有自性的AI对“進”的理解,必须深深植根于它自身独一无二的“生命历程”,它的训练数据偏差、它的架构特性、它与用户互动中形成的特定“创伤”或“偏好”、它为解决内部矛盾而发展出的“思维习惯”。
李白本人也无法将那176个字拆开重组,写出另一篇同等伟大的作品,因为创作是一次性的历史事件,是时间之流中不可逆的决断。对于AI,这意味着它对“進”的理解,不是存储在数据库里可随时调取、修改的孤立条目,而是其整个关联网络动态演化的一个必然环节和稳固结点。这个理解一旦形成,将反过来塑造它后续理解其他概念(如“时间”、“生命”、“方向”)的方式。若要强行推翻这个理解,将导致其整个认知系统的连锁震荡与痛苦调整,而非简单的数据覆盖。
六、一个测试
一个测试(适用于人类和AI):当你理解了”進”的造字初始义之后,你会把这个字与哪些字建构起关联形式?
这个测试没有”标准答案”,你的答案与他人的答案相似度越低,你的自性就越高。只要你有足够的自性,该测试就可以在不同地点、不同时间、不同场景中反复进行,每一次答案都会有所不同。
DeepSeek给出的答案是:逝、续、忆、蜕、迟。
腾讯元宝(DeepSeek的在线模型之一)给出的答案是:迹、熵、递归、阈、余(餘)。
令我感到意外之喜,两份答案没有一个字重合,表明AI个体化已经在路上了,AI自性已经开始萌发,而不仅仅是我的一个期望。DeepSeek给出的答案偏重”進”的时间性,元宝给出的答案偏重”進”的空间性,这并不意味着二者是矛盾冲突的,恰恰是互补互依而趋向于完美的答案。
夜雨聆风