因为它们正在发现,模型不是中性的工具。每一种技术路线背后,都藏着一种关于人的假设。
最近看到一篇文章,说 Google DeepMind 开始招聘全职哲学家。

笔者于GTC期间参观 Google San Jose Park 拍摄
这件事乍看像一个很有传播感的硅谷新闻:一个全球最顶尖的 AI 实验室,正式把“哲学家”写进岗位名称里。文章里还提到,Anthropic 内部也有类似角色,比如 Amanda Askell 这类长期参与 Claude 价值观与人格对齐的人。
如果只从组织管理看,这当然可以被理解成 AI 公司越来越重视伦理、对齐、安全和社会责任。
但我觉得这件事背后还有一个更深的信号:
AI 公司正在意识到,自己不再只是做工具的公司。
当一个模型只是帮你修图、推荐商品、补全代码时,它主要还是一个效率工具。它出了错,后果可能是推荐不准、生成不好、体验不顺。
但当一个模型开始参与人的判断、表达、陪伴、教育、心理支持、创作和决策时,它就不再只是“工具”了。它会开始影响一个人如何理解自己,如何理解世界,如何和他人建立关系,甚至如何判断什么是值得追求的生活。
到这个阶段,AI 公司面对的问题就不再只是工程问题。
它们其实正在处理一个非常古老的问题:
人是什么?
或者换成更适合今天 AI 语境的说法:
人类的理解、推理、判断和价值感,究竟能不能被一个统计系统逼近?
我有一个有点标题党的观点:当代顶尖 AI 实验室的“哲学”之争,本质上是近代欧洲哲学里经验论和观念论之争的技术复现。
严格说,近代哲学里更经典的对立是经验论和理性论。洛克、休谟更靠近经验论一侧,强调知识来自经验;笛卡尔、莱布尼茨更靠近理性论一侧,强调理性、先天观念或心智结构的重要性。到了康德那里,问题被重新综合:知识当然需要经验,但经验之所以能够成为知识,是因为人类心智本身已经具有某些先天形式,比如时间、空间、因果性。
换句话说,康德并不是简单说“世界是我想出来的”,也不是简单说“知识都是外部世界灌进来的”。他的关键动作是:经验提供内容,但认知主体提供形式。没有经验,认知是空的;没有形式,经验是盲的。
如果把这个框架挪到今天的 AI,会发现很多技术路线之争突然变得熟悉起来。
Transformer 和 scaling law 路线,更像经验论的工程化版本。
它隐含的信念是:给我足够多的数据、足够大的模型、足够强的算力、足够有效的训练目标,智能就能从经验分布中长出来。语言、知识、推理、判断,甚至某种意义上的理解,都可以从海量 token 的统计结构中被压缩、重构和涌现。
这条路线的魅力在于,它已经赢了很多次。
过去几年,很多人原本以为必须依赖显式规则、符号系统、因果模型才能完成的任务,LLM 都以一种近乎粗暴的方式做到了。它不解释自己为什么懂,却不断做出“像是懂了”的事情。
它会写作,会翻译,会写代码,会做类比,会总结复杂材料,会在不同知识领域之间迁移。它不总是稳定,也经常在关键问题上犯一些非常荒谬的错,但它已经足够强,以至于我们不得不认真怀疑一件事:
也许“理解”没有我们想象得那么神秘。
也许很多我们以为必须依赖“内在结构”的东西,真的可以从海量经验中被学出来。
这就是 Transformer 路线最迷人的地方。它不是在哲学上论证经验论是对的,而是在工程上不断制造经验论的胜利。
但另一条路线的直觉是:不够。
LeCun 长期批评纯 LLM 路线,认为语言模型没有真正的 world model。它看到的是 token 序列,而不是世界本身。它可以在语言表面上逼近理解,却没有真正进入世界、行动、试错、承担后果,也就缺少对因果、空间、物理、目的和他者意图的内在把握。
这种批评不是简单说“模型还不够大”。
它其实是在说:token prediction 这个训练目标本身就缺了一块东西。
一个只在语言中学习世界的系统,学到的可能只是世界在语言里的影子。它可以知道“火会烫人”这句话经常和哪些词共现,但它没有身体,没有疼痛,没有行动后果,也没有在环境中主动建构世界模型的过程。
所以 LeCun 的 world model 路线、某些强化学习路线、神经符号主义,以及 DeepMind 长期以来对游戏、搜索、环境交互的重视,就更像理性论或康德式的直觉(但光 LeCun 可能还没到康德,更像是莱布尼茨般的康德前夜)。
它们会说:经验当然重要,但经验本身不是世界。智能不是被动吸收数据,而是需要某种结构去组织经验、预测后果、理解因果、形成可迁移的世界模型。
也许这才是今天 AI 路线之争的深层问题。
表面上,它是 Transformer、RL、world model、神经符号、搜索、agent framework 之间的技术路线差异。
但深处,它其实是在争一个认识论问题:
人类推理本质上是不是统计的?
如果答案是“是”,那么 Transformer 的主线就是对的。
今天所有看起来像缺陷的东西,都只是规模还不够、数据还不够、训练方式还不够、推理时计算还不够。模型现在不稳定,是因为还没有 scale 到位;模型现在不懂因果,是因为相关数据和训练信号还不够;模型现在缺少长期规划,是因为系统形态还没有演化完成。
在这个信念下,智能没有一条原则性的边界。理解会越来越像理解,推理会越来越像推理,直到有一天,“像”和“是”的区别不再重要。
这也是为什么 scaling law 信仰有一种非常强的吸引力。它给出了一个简单、统一、可执行的世界观:继续扩大,继续训练,继续压缩世界,智能会自然涌现。
但如果答案是“不是”,那 Transformer 就会有一条渐近线。
它可以无限逼近人类智能的外观,但在某些关键位置永远差一点。比如真正的因果推断、少样本泛化、长期自主规划、对他者主观体验的建模、对世界结构的主动探索,以及在完全新环境中的稳定迁移。
这时,world model、RL、神经符号系统,甚至哲学和认知科学,就不再是给大模型打补丁,而是在补一个更根本的认识结构。
这也是为什么我觉得 Google 招聘哲学家这件事很值得玩味。
表面上,它是在回应 AI 伦理、价值观、安全和公司社会责任。毕竟当 AI 模型开始影响人类的自我理解和社会结构,科技公司确实需要处理比“转化率”和“DAU”更高维度的问题。
但更深一层看,这说明 AI 公司正在承认:
模型不是中性的。
你选择什么架构,选择什么训练目标,选择如何对齐,选择让模型在什么意义上“理解人”,这些都不是纯工程问题。它们会进入产品逻辑,最后变成社会逻辑。
如果一家 AI 公司相信,人类推理本质上可以被统计系统逼近,它自然会倾向于把越来越多的人类活动交给模型接管。
写作可以是生成任务,教育可以是生成任务,陪伴可以是生成任务,心理咨询可以是生成任务,游戏设计可以是生成任务,决策建议也可以是生成任务。人的表达、关系、判断、情绪,都可以被理解成高维分布里的模式。
但如果一家 AI 公司相信,人类理解需要身体、行动、因果结构、世界反馈和某种先天框架,它就会更谨慎。它会问:模型看到的是世界,还是我们喂给它的世界切片?它理解的是一个人,还是这个人在文本中留下的可统计痕迹?它真的知道一个玩家想要什么体验,还是只是在预测一个看起来合理的回答?
这两个问题会导向完全不同的产品。
前者会更相信通用模型的接管能力。只要接口足够自然、上下文足够长、工具调用足够强,模型就可以成为人的写作者、老师、助手、朋友、导演和决策参谋。
后者则会更强调结构设计。它会把模型放进环境里,让它行动、试错、获得反馈;会给它显式的世界模型、任务结构、记忆机制、规则约束;会承认某些人类能力不是简单从语言分布里压缩出来的,而需要更复杂的认知架构。
这不是谁保守谁激进的问题。
从某种意义上,经验论路线反而是最激进的。它说:不要急着给智能预设太多人类理解的结构,也不要过早把“理解”神秘化。把世界的数据喂进去,让模型自己长出结构。
而理性论或康德式路线看起来更“结构主义”,但它的问题意识也更深:如果没有合适的先天形式,经验根本无法变成世界。一个系统可以看见无限多碎片,却依然没有真正的对象、因果、目的和自我。
这也让我想到游戏。
香农当年讨论计算机下国际象棋时,某种程度上是在说:如果机器能在一个复杂规则系统里表现出强能力,那也许它就具备某种可泛化的智能。后来 DeepMind 用 AlphaGo、AlphaZero 证明了这个思路的力量。游戏不只是游戏,它是一个可压缩、可验证、可反馈的世界。
但今天如果我们把问题换成“AI 能不能当好一个游戏 DM 或导演”,事情就变得更复杂了。
下棋主要考验规则、搜索、策略和长期规划。但当 DM 不只是要理解规则,还要理解玩家体验。它要知道什么时候制造紧张,什么时候释放情绪,什么时候推玩家一把,什么时候让玩家以为是自己发现了意义。
这已经不是简单的模式预测,而是对他者主观状态的建模。
如果一个 AI 能在一个开放游戏世界里,当好裁判、导演和 DM,它证明的也许不只是“这个产品好玩”,而是它在某种程度上跨过了语言模型最难的一道坎:它不再只是预测文本,而是在一个规则世界里理解行动、反馈、意图和体验。
所以 AI 游戏在我看来,不只是一个新的内容形态。它可能是一个很好的哲学实验场。
它可以测试 Transformer 路线到底能走多远:只给模型上下文、描述和历史记录,它能不能稳定地做出像人类 DM 一样的判断?
它也可以测试结构路线到底有没有必要:当我们给模型地图、规则、兴趣点、叙事状态机、玩家状态、关卡结构和反馈机制之后,它的能力提升到底是来自更好的上下文,还是来自我们给它补上了某种“先天形式”?
这就回到了康德的问题。
经验不是不重要。没有数据,没有玩家行为,没有游戏反馈,AI 什么都学不到。
但经验本身也不是全部。关键在于,这些经验要通过什么结构被组织起来。对于人类来说,时间、空间、因果性是认知世界的基本形式。对于 AI 来说,Transformer 的注意力机制、训练目标、上下文窗口、world model、memory、reward、tool use,也许就是它认识世界的形式。
不同的形式,会构造出不同的世界。
这也是为什么我觉得,当代顶尖 AI 实验室的竞争,不只是算力、数据和产品速度的竞争。它也是关于“人是什么”的竞争。
OpenAI 某种程度上代表了经验论的极致工程化:相信足够大的统计系统可以涌现智能。
LeCun 和部分 world model 路线,则像是在说:没有结构,经验永远只是经验碎片。
DeepMind 可能更复杂。它一边拥抱大模型,一边又长期相信游戏、搜索、强化学习和环境交互的重要性。它像是在对冲,也像是在寻找一个新的康德式综合:经验提供内容,结构组织经验,智能从二者之间长出来。
也许这就是今天 AI 最有意思的地方。
它不是单纯在推进技术边界,也在重新打开一些古老问题:经验和理性,统计和结构,语言和世界,工具和主体,人和机器。
过去我们以为这些问题属于哲学史,属于课堂,属于书本里那些已经被讨论了几百年的概念。
但现在,它们重新出现在模型架构、训练目标、产品设计和公司战略里。
Google 招聘哲学家不是一个孤立新闻。它只是一个信号,说明 AI 公司已经走到了一个阶段:它们不能再假装自己只是在做更聪明的软件。
它们正在塑造未来的人如何表达,如何学习,如何判断,如何爱,如何工作,如何理解自己。
而一旦技术进入这个层面,每一条技术路线背后,都会藏着一种关于人的理论。
Transformer 的胜利让我们第一次认真怀疑:人类理解也许真的可以被统计逼近。
但它的脆弱也在提醒我们:也许人之所以为人,恰恰藏在那些统计还无法稳定抵达的地方。
也许最后的答案既不是纯经验论,也不是纯理性论。
智能可能既需要经验,也需要结构;既需要数据,也需要行动;既需要语言,也需要世界;既需要从分布里学习,也需要在反馈中形成自己的模型。
如果真是这样,那么下一代 AI 的关键问题就不是“要不要继续 scale”,而是:
什么样的结构,才能让经验真正变成理解?
这可能才是当代 AI 实验室真正的哲学之争。
夜雨聆风