AI 与维特根斯坦:语言的边界,还是智能的边界

前两天看罗永浩与蔡康永的播客对谈，想起蔡康永书上提起过，你说什么样的话，你就是什么样的人。深以为然。

——You are what you say about.

一个不爱说话的人做项目经理是个灾难，所以我常以此句为凭让自己尽量多的把脑子里的思维转换成语言表达出来，因为一个人有多少能力只能从你能说出多少话来体现。你说不出来就是没有。所以造就了我工作中话多，生活中话少的性格。

后来接触维特根斯坦的理论，他有一句名言：“语言的边界就是我世界的边界。”

不是全部的世界，是每个人的世界都是自己的语言构建的。你能表达多少内容代表你的思维层次有多厚，如果你表达不出来很难证明你真的知道，你看过了只是代表你浏览了，你能复述也只能是你记着了，你再用你自己的话说出来才能叫理解了，能把它和你脑中的其他知识串联就是构建了体系，能对比跨领域的内容是知识泛化和抽象的过程，这样你才能把现象提炼成概念总结出规律形成你自己的道，你的方法论。

牛顿能把苹果掉落和地球绕着太阳转这看起来毫不相关的事情挖掘出它的内在原因，他把这些现象都定义成一个规律叫万有引力。所以人类在生物界的霸权是他能给任何事物起名字下定义，我认为这是智人诞生的标志，早期原始人先学会了生存沟通必须的动词：吃、喝、猎、躲、跑。

随着人类发展不再满足于遇到什么动物吃什么动物就约定天上飞的叫鸟、水里游的叫鱼，地上跑的叫兽。这时候我们就已经会给事物打标签了。这与现在说你是i人他是e人，你内向他外向本质没什么区别。都是为了把相似的生物人为的做概念分类帮助你形成规律形成你的道，道就是规律。

老子说“道可道，非常道；名可名，非常名。”——能说出来的道，不是永恒的道；能命名的事物，不是永恒的事物。这与维特根斯坦的命题形成了跨越时空的呼应。

这似乎与前面说的人类的跨越又矛盾了，人类好不容易学会了定义一件事物，怎么老子又说能被定义的都不值钱了呢。

无独有偶，佛曰“不可说。”

因为佛认为语言文字存在局限，无法承载深邃的真理。语言属于“世俗谛”，是用来沟通的方便工具，而真理属于“胜义谛”，超越概念分别，用有限的工具无法描述无限的真实。

如果直接用语言定义真理，众生容易执着于文字表面，而忽略了真正的体悟，所以“不可说”是为了破除对语言的执着。所以佛说佛性、涅槃境界如同喝水冷暖自知，只能通过修行实践去亲身证知，无法像传授知识一样通过语言传递。

说回牛顿，他把本来一束单纯的阳光，拆分出了光谱分离出了赤橙黄绿青蓝紫。他把本来连续的一道光定义出了更多的概念。后来的科学家又在里面分离出了红外线、紫外线。到了现代又分出了原子光谱和分子光谱。所以你说什么时候用语言定义这道光是正确的呢。

我们说一个人的性格，通过这个人表现的不爱说话，喜欢独处，自己戴耳机听音乐来判断说这个人是内向性格。有没有可能是这个人只是跟你在一块的时候表现的“内向”只是因为不喜欢你通过这种行为让你远离而你却草率的给对方扣上一个内向的帽子。

然后你又通过那个人表现的爱旅行、爱攒饭局、爱演讲来判断说这个性格是外向。但也有可能他长期工作压抑就靠这些活动来临时的释放压力，关起门来反而更孤独。曾经写出“面朝大海，春暖花开”这样美丽积极向上诗句的作家海子两个月后就卧轨了，谁又看出他积极中的凄凉了。

最近流行的概念说有些人ADHD多动症或者ASD自闭，或者MBTI的性格分类：绿老头、小蝴蝶、快乐小狗。这都是在把“人类”这本来就在一个谱系中的物种人为的打上了不同的标签，而这些标签的定义本来就是受认知局限的。有些人就是有时候内向有时候外向，60%外向+40%内向。人多的时候就人来疯，人少的时候就闭门不出。不止是人，很多事物都是复杂的难以用一个语言来准确的描述和定义一件事。

麻烦的是，人与人的沟通，只能靠语言。

而“不可说”的有直觉、经验、先验、超验、真理等等如何靠语言文字传递。语言是对概念的抽象和提炼。人拥有超越语言的感受——如直觉和感知。这些感受是连续的，而语言是离散的。

在这方面，AI在向量空间中表示和理解世界，他的理解方式与人类不同。它在处理连续谱系的问题上有着天然优势，它不会强行把连续的事物切成离散的标签。比如我们说一个女孩好看形容她眼睛大、高鼻梁、白皮肤。而这样的人不胜枚举，你很难通过这样的描述来锁定一个人。如果进一步让你一定描述出她的长相，你绞尽脑汁会怎么用语言描述？可能是说她的眼睛挺大像刘亦菲那样，鼻子挺高像迪丽热巴那样，嘴巴很大像姚晨。而这传递的其实是一种感觉，对方如果不认识这几个人就根本不知道你在说什么。而你又如何确定对方的认知中姚晨的嘴巴在他看来是不是算大呢。

真实世界是连续的、多维的、多模态的。（包含物理法则、空间感知、微观粒子运动甚至人类的直觉与潜意识）。而语言是一套离散的符号系统。当我们试图描述世界时，必须将高维的连续体验压缩成线性的文字。在这个过程中，大量的信息被损耗了。语言只能是我们唯一能大规模协作、传递信息的工具。（未来我很乐意于讨论《三体》人中的全物种的思维共享的思想实验，也行那将是真正的“得救之道”？）

所以文字是我们所能看到的人类世界的投射，那么AI大模型就是将它转化为数学向量再经过运算后，再次发回我们能识别的文字。

我在用Stable Diffusion生成图片的时候他可以设定生成0.3的大眼睛，0.5的眼窝深度，0.7的白皮肤，再加0.3的咖啡色。这就是向量和语言的差别。

语言的局限性是否会限制人类的发展我不知道，但人与人的沟通和认知差异甚至比人和狗在基因上的差异还大这是科学事实。

说回“语言的边界就是我世界的边界。”这句话的主语不是说语言的宏大，反而是表达个体的无力。他不是在说语言的伟大能概括人类的思维模式，而是在说他只能用仅有的语言来认知有限的世界。

现在的AI大模型还是依赖统计和概率重新拟合成新答案输出给你，虽然他不仅仅是一种输入法预测下一个字概率多少而形成的智能，否则先研究出AI的应该是搜狗。但目前来说模型聪明一点和笨一点，能耗高一点低一点。能否用更少的算力来支持更多的回答。

其实无非是模型专注力的稠密还是稀疏，稀疏模型更省算力也更快解答，更省显还让显卡跌价。其核心也只是筛选掉了可能不重要的一些数据源而只抓概率重复高的组合成新答案反馈给你。就像我曾经做的轨迹定位APP遇到的难题是硬件本身经常会因为定位不准而漂移，1分钟不到的时间内从中国漂移到非洲，轨迹显示绕着地球转。而我解决不了硬件问题就从软件入手把短时间内漂移的定位点直接丢弃反而解决了问题。但这不是技术提升只是一个算法的选择。

基于统计和概率的AI神经网络模型能否涌现智能我不知道，但他的“思维”是个黑盒他的思维过程我们看不到，所以我们反而要反向的研究AI如何在向量空间思维的线索来给人类思维升维，这样是否会有一天，不可说的可说了，不可名的可名了。

那么AI本质是技术革命，还是思想革命呢。