AI 公司为什么需要哲学家?

因为它们正在发现，模型不是中性的工具。每一种技术路线背后，都藏着一种关于人的假设。

最近看到一篇文章，说 Google DeepMind 开始招聘全职哲学家。

笔者于GTC期间参观 Google San Jose Park 拍摄

这件事乍看像一个很有传播感的硅谷新闻：一个全球最顶尖的 AI 实验室，正式把“哲学家”写进岗位名称里。文章里还提到，Anthropic 内部也有类似角色，比如 Amanda Askell 这类长期参与 Claude 价值观与人格对齐的人。

如果只从组织管理看，这当然可以被理解成 AI 公司越来越重视伦理、对齐、安全和社会责任。

但我觉得这件事背后还有一个更深的信号：

AI 公司正在意识到，自己不再只是做工具的公司。

当一个模型只是帮你修图、推荐商品、补全代码时，它主要还是一个效率工具。它出了错，后果可能是推荐不准、生成不好、体验不顺。

但当一个模型开始参与人的判断、表达、陪伴、教育、心理支持、创作和决策时，它就不再只是“工具”了。它会开始影响一个人如何理解自己，如何理解世界，如何和他人建立关系，甚至如何判断什么是值得追求的生活。

到这个阶段，AI 公司面对的问题就不再只是工程问题。

它们其实正在处理一个非常古老的问题：

人是什么？

或者换成更适合今天 AI 语境的说法：

人类的理解、推理、判断和价值感，究竟能不能被一个统计系统逼近？

我有一个有点标题党的观点：当代顶尖 AI 实验室的“哲学”之争，本质上是近代欧洲哲学里经验论和观念论之争的技术复现。

严格说，近代哲学里更经典的对立是经验论和理性论。洛克、休谟更靠近经验论一侧，强调知识来自经验；笛卡尔、莱布尼茨更靠近理性论一侧，强调理性、先天观念或心智结构的重要性。到了康德那里，问题被重新综合：知识当然需要经验，但经验之所以能够成为知识，是因为人类心智本身已经具有某些先天形式，比如时间、空间、因果性。

换句话说，康德并不是简单说“世界是我想出来的”，也不是简单说“知识都是外部世界灌进来的”。他的关键动作是：经验提供内容，但认知主体提供形式。没有经验，认知是空的；没有形式，经验是盲的。

如果把这个框架挪到今天的 AI，会发现很多技术路线之争突然变得熟悉起来。

Transformer 和 scaling law 路线，更像经验论的工程化版本。

它隐含的信念是：给我足够多的数据、足够大的模型、足够强的算力、足够有效的训练目标，智能就能从经验分布中长出来。语言、知识、推理、判断，甚至某种意义上的理解，都可以从海量 token 的统计结构中被压缩、重构和涌现。

这条路线的魅力在于，它已经赢了很多次。

过去几年，很多人原本以为必须依赖显式规则、符号系统、因果模型才能完成的任务，LLM 都以一种近乎粗暴的方式做到了。它不解释自己为什么懂，却不断做出“像是懂了”的事情。

它会写作，会翻译，会写代码，会做类比，会总结复杂材料，会在不同知识领域之间迁移。它不总是稳定，也经常在关键问题上犯一些非常荒谬的错，但它已经足够强，以至于我们不得不认真怀疑一件事：

也许“理解”没有我们想象得那么神秘。

也许很多我们以为必须依赖“内在结构”的东西，真的可以从海量经验中被学出来。

这就是 Transformer 路线最迷人的地方。它不是在哲学上论证经验论是对的，而是在工程上不断制造经验论的胜利。

但另一条路线的直觉是：不够。

LeCun 长期批评纯 LLM 路线，认为语言模型没有真正的 world model。它看到的是 token 序列，而不是世界本身。它可以在语言表面上逼近理解，却没有真正进入世界、行动、试错、承担后果，也就缺少对因果、空间、物理、目的和他者意图的内在把握。

这种批评不是简单说“模型还不够大”。

它其实是在说：token prediction 这个训练目标本身就缺了一块东西。

一个只在语言中学习世界的系统，学到的可能只是世界在语言里的影子。它可以知道“火会烫人”这句话经常和哪些词共现，但它没有身体，没有疼痛，没有行动后果，也没有在环境中主动建构世界模型的过程。

所以 LeCun 的 world model 路线、某些强化学习路线、神经符号主义，以及 DeepMind 长期以来对游戏、搜索、环境交互的重视，就更像理性论或康德式的直觉（但光 LeCun 可能还没到康德，更像是莱布尼茨般的康德前夜）。

它们会说：经验当然重要，但经验本身不是世界。智能不是被动吸收数据，而是需要某种结构去组织经验、预测后果、理解因果、形成可迁移的世界模型。

也许这才是今天 AI 路线之争的深层问题。

表面上，它是 Transformer、RL、world model、神经符号、搜索、agent framework 之间的技术路线差异。

但深处，它其实是在争一个认识论问题：

人类推理本质上是不是统计的？

如果答案是“是”，那么 Transformer 的主线就是对的。

今天所有看起来像缺陷的东西，都只是规模还不够、数据还不够、训练方式还不够、推理时计算还不够。模型现在不稳定，是因为还没有 scale 到位；模型现在不懂因果，是因为相关数据和训练信号还不够；模型现在缺少长期规划，是因为系统形态还没有演化完成。

在这个信念下，智能没有一条原则性的边界。理解会越来越像理解，推理会越来越像推理，直到有一天，“像”和“是”的区别不再重要。

这也是为什么 scaling law 信仰有一种非常强的吸引力。它给出了一个简单、统一、可执行的世界观：继续扩大，继续训练，继续压缩世界，智能会自然涌现。

但如果答案是“不是”，那 Transformer 就会有一条渐近线。

它可以无限逼近人类智能的外观，但在某些关键位置永远差一点。比如真正的因果推断、少样本泛化、长期自主规划、对他者主观体验的建模、对世界结构的主动探索，以及在完全新环境中的稳定迁移。

这时，world model、RL、神经符号系统，甚至哲学和认知科学，就不再是给大模型打补丁，而是在补一个更根本的认识结构。

这也是为什么我觉得 Google 招聘哲学家这件事很值得玩味。

表面上，它是在回应 AI 伦理、价值观、安全和公司社会责任。毕竟当 AI 模型开始影响人类的自我理解和社会结构，科技公司确实需要处理比“转化率”和“DAU”更高维度的问题。

但更深一层看，这说明 AI 公司正在承认：

模型不是中性的。

你选择什么架构，选择什么训练目标，选择如何对齐，选择让模型在什么意义上“理解人”，这些都不是纯工程问题。它们会进入产品逻辑，最后变成社会逻辑。

如果一家 AI 公司相信，人类推理本质上可以被统计系统逼近，它自然会倾向于把越来越多的人类活动交给模型接管。

写作可以是生成任务，教育可以是生成任务，陪伴可以是生成任务，心理咨询可以是生成任务，游戏设计可以是生成任务，决策建议也可以是生成任务。人的表达、关系、判断、情绪，都可以被理解成高维分布里的模式。

但如果一家 AI 公司相信，人类理解需要身体、行动、因果结构、世界反馈和某种先天框架，它就会更谨慎。它会问：模型看到的是世界，还是我们喂给它的世界切片？它理解的是一个人，还是这个人在文本中留下的可统计痕迹？它真的知道一个玩家想要什么体验，还是只是在预测一个看起来合理的回答？

这两个问题会导向完全不同的产品。

前者会更相信通用模型的接管能力。只要接口足够自然、上下文足够长、工具调用足够强，模型就可以成为人的写作者、老师、助手、朋友、导演和决策参谋。

后者则会更强调结构设计。它会把模型放进环境里，让它行动、试错、获得反馈；会给它显式的世界模型、任务结构、记忆机制、规则约束；会承认某些人类能力不是简单从语言分布里压缩出来的，而需要更复杂的认知架构。

这不是谁保守谁激进的问题。

从某种意义上，经验论路线反而是最激进的。它说：不要急着给智能预设太多人类理解的结构，也不要过早把“理解”神秘化。把世界的数据喂进去，让模型自己长出结构。

而理性论或康德式路线看起来更“结构主义”，但它的问题意识也更深：如果没有合适的先天形式，经验根本无法变成世界。一个系统可以看见无限多碎片，却依然没有真正的对象、因果、目的和自我。

这也让我想到游戏。

香农当年讨论计算机下国际象棋时，某种程度上是在说：如果机器能在一个复杂规则系统里表现出强能力，那也许它就具备某种可泛化的智能。后来 DeepMind 用 AlphaGo、AlphaZero 证明了这个思路的力量。游戏不只是游戏，它是一个可压缩、可验证、可反馈的世界。

但今天如果我们把问题换成“AI 能不能当好一个游戏 DM 或导演”，事情就变得更复杂了。

下棋主要考验规则、搜索、策略和长期规划。但当 DM 不只是要理解规则，还要理解玩家体验。它要知道什么时候制造紧张，什么时候释放情绪，什么时候推玩家一把，什么时候让玩家以为是自己发现了意义。

这已经不是简单的模式预测，而是对他者主观状态的建模。

如果一个 AI 能在一个开放游戏世界里，当好裁判、导演和 DM，它证明的也许不只是“这个产品好玩”，而是它在某种程度上跨过了语言模型最难的一道坎：它不再只是预测文本，而是在一个规则世界里理解行动、反馈、意图和体验。

所以 AI 游戏在我看来，不只是一个新的内容形态。它可能是一个很好的哲学实验场。

它可以测试 Transformer 路线到底能走多远：只给模型上下文、描述和历史记录，它能不能稳定地做出像人类 DM 一样的判断？

它也可以测试结构路线到底有没有必要：当我们给模型地图、规则、兴趣点、叙事状态机、玩家状态、关卡结构和反馈机制之后，它的能力提升到底是来自更好的上下文，还是来自我们给它补上了某种“先天形式”？

这就回到了康德的问题。

经验不是不重要。没有数据，没有玩家行为，没有游戏反馈，AI 什么都学不到。

但经验本身也不是全部。关键在于，这些经验要通过什么结构被组织起来。对于人类来说，时间、空间、因果性是认知世界的基本形式。对于 AI 来说，Transformer 的注意力机制、训练目标、上下文窗口、world model、memory、reward、tool use，也许就是它认识世界的形式。

不同的形式，会构造出不同的世界。

这也是为什么我觉得，当代顶尖 AI 实验室的竞争，不只是算力、数据和产品速度的竞争。它也是关于“人是什么”的竞争。

OpenAI 某种程度上代表了经验论的极致工程化：相信足够大的统计系统可以涌现智能。

LeCun 和部分 world model 路线，则像是在说：没有结构，经验永远只是经验碎片。

DeepMind 可能更复杂。它一边拥抱大模型，一边又长期相信游戏、搜索、强化学习和环境交互的重要性。它像是在对冲，也像是在寻找一个新的康德式综合：经验提供内容，结构组织经验，智能从二者之间长出来。

也许这就是今天 AI 最有意思的地方。

它不是单纯在推进技术边界，也在重新打开一些古老问题：经验和理性，统计和结构，语言和世界，工具和主体，人和机器。

过去我们以为这些问题属于哲学史，属于课堂，属于书本里那些已经被讨论了几百年的概念。

但现在，它们重新出现在模型架构、训练目标、产品设计和公司战略里。

Google 招聘哲学家不是一个孤立新闻。它只是一个信号，说明 AI 公司已经走到了一个阶段：它们不能再假装自己只是在做更聪明的软件。

它们正在塑造未来的人如何表达，如何学习，如何判断，如何爱，如何工作，如何理解自己。

而一旦技术进入这个层面，每一条技术路线背后，都会藏着一种关于人的理论。

Transformer 的胜利让我们第一次认真怀疑：人类理解也许真的可以被统计逼近。

但它的脆弱也在提醒我们：也许人之所以为人，恰恰藏在那些统计还无法稳定抵达的地方。

也许最后的答案既不是纯经验论，也不是纯理性论。

智能可能既需要经验，也需要结构；既需要数据，也需要行动；既需要语言，也需要世界；既需要从分布里学习，也需要在反馈中形成自己的模型。

如果真是这样，那么下一代 AI 的关键问题就不是“要不要继续 scale”，而是：

什么样的结构，才能让经验真正变成理解？

这可能才是当代 AI 实验室真正的哲学之争。