3 分钟 AI 学院 | Palantir 二十年前的一个架构决定,正在被四家公司同时重新发明

从五角大楼到华尔街，从电信运营商到 DeepMind 的招聘启事——"本体"这个词，正在悄悄定义下一代技术的竞争规则。

亚里士多德在《范畴篇》里问了一个问题：世界上的东西，到底可以分成几类？实体、性质、数量、关系……他认为，如果你不先把"存在"的范畴搞清楚，你就没法思考任何东西。

两千三百年后，这个问题不在哲学课本里复活——它在硅谷的服务器机房里复活了。

2003 年，美国国防部的分析师们面对一个尴尬的问题：情报数据散布在几十个互不相通的系统里，分析师想把"某人在某地购买了某种化学品"和"某组织正在招募化学专业学生"这两条信息关联起来，得手动跨系统翻查。

Palantir 的解决方案不是做一个更好的搜索引擎，而是建了一套叫 Ontology（本体）的东西。

简单说，他们把数据库里那些冰冷的表格字段——"entity_type_003"、"location_code_7B"——翻译成了人能看懂的语言：人物、地点、事件、关系。数据库的底层保持极度通用，只存对象、属性、链接这些最基本的元素。具体含义，由一层叫 Ontology 的东西在上方重新定义。

前 Palantir 第二位工程师、前 OpenAI 首席研究官 Bob McGrew 后来回忆这套架构时说：如果只面向某一家客户构建功能，就会被这个客户的表述方式绑架。正确做法是把抽象层级往上提，思考"我们是否有一个对所有拥有某种属性的对象都适用的通用操作"。[1]

这个思路在 Palantir 服务政府和军方客户的二十年里被反复验证。但到了 2026 年，它突然在几个完全不同的领域同时冒了出来。

在往下走之前，先搞清楚"本体"到底是什么

"本体"这个词在中文里自带一层迷雾。在往下看四个故事之前，先把它拆成三句话：

最底层，本体是一种数据架构——用最通用的底层存储 + 最灵活的语义映射层，让同一套系统能服务完全不同行业的客户。

中间层，本体是一种知识工程——把隐藏在代码、文档、人脑中的业务规则提炼成结构化的、AI 能理解的、可验证的规格说明。

最顶层，本体是一种存在论——关于什么东西存在、存在的意义是什么、我们如何认识存在。

三个层面，一层比一层深。接下来的四个故事，从这三层出发，一路延伸。

本体最基础的一层用法：给数据赋予意义

华尔街的回答

2026 年 5 月，Anthropic 的官方博客讲了 Kepler 的故事。[2]

Kepler 是一家 2025 年成立的金融 AI 公司，创始人 Vinoo Ganesh 和 John McRaven 都来自 Palantir。创业前他们跟 147 家金融机构聊了一圈，得到的回答几乎一样：大家都想用 AI 做研究，但没人信任 AI 的输出。一位基金经理的原话是："一个我没法审计的东西，我怎么信它？"

Kepler 的解法是给 Claude 划一条严格的能力边界：AI 只做理解和推理，不做计算。

具体来说，Claude 负责解读用户的意图、识别歧义、生成结构化的执行计划。之后的所有数值计算——算比率、对齐会计期间、处理重述——全部交给确定性的公式引擎。两个阶段之间有清晰的输入输出契约。

在这个管线中，Kepler 构建了一层"专有本体论"（Proprietary Ontology）：把金融概念映射到精确定义和公式。每个用户可以根据自己的需求做定制。加上确定性执行环境、访问控制、可复用的 Skills，四个层面构成了一个"确定性基础设施层"。

三个月内，他们索引了 2600 万份以上的 SEC 文件、5000 万份公开文档、100 万份私有文档，覆盖 27 个全球市场的 14000 多家公司。

Kepler 的团队对模型选择也有讲究。在多步骤、相互依赖的长程推理任务上，他们发现 Claude Opus 4.7 是唯一能"从头到尾守住所有约束"的模型——其他模型"在第五步会悄悄丢掉一个约束"。高吞吐的受限任务则交给 Sonnet 4.6。

McRaven 总结了一句很到位的话：Prompt engineering 优化的是一次调用，Content engineering 优化的是围绕调用的整个系统。[2] 前者是教 AI 怎么回答一个问题；后者是给 AI 建好它回答问题时需要的所有脚手架。Kepler 选择了后者，而"专有本体论"就是脚手架中最核心的那一层。[2]

Kepler 的"本体"，是最底层的含义：一种数据架构。用最通用的底层存储 + 最灵活的语义映射，让 AI 在结构化的事实之上工作，而不是凭空编造。

给数据赋予意义——这是本体最基础的一层用法。但 AI 要代理人的工作，光懂数据远远不够。

更深一层：从代码里挖出业务规则

亚信的"三驾马车"

同一个月，阿里云峰会 AI 编程专场上，亚信科技首席架构师朱军提出了另一个答案。[3]

亚信做的是电信运营商的业务系统——5G 套餐、合约条款、销售渠道这些东西，原来埋在几十万行代码和数据库表结构里，只有老员工知道哪段代码对应哪个业务规则。

朱军打了个比方：他们要做的，就像给一整个仓库的零件写一本说明书——本体知识是说明书，本体孪生是那个仓库，看了说明书就知道怎么从仓库里找到正确的零件。

具体来说，本体知识不是知识图谱——那太具体了。它定义的是规则层面的东西：某类客户能采纳什么产品，通过哪些销售渠道，销售规则是什么。本体孪生则是把业务中台从微服务升级为跟本体知识对齐的数字孪生系统——5G 套餐合同中的每一项内容，都能直接激活系统中对应的功能。

然后是 Agent。不同岗位的 Agent——营销的、客服的、运维的——各自需要不同的技能包，但都基于同一套本体知识来理解系统。朱军管这叫"Skills over Ontology"：营销 Agent 只关心营销手册和营销系统，客服 Agent 只关心客服手册和客服系统，但它们对"客户""产品""订单"这些基本概念的理解是统一的。

亚信引用了哲学家卡尔·波普尔的"三世界"框架来做哲学背书：本体知识对应"知识世界"，本体孪生对应"数字化的物理世界"，Agent 对应"模拟的意识世界"。这个类比有点远，但它指向了一个真实的问题：AI 要代理人的工作，光有语言能力不够，它得先理解这个世界是怎么组织的。

亚信的"本体"，是中间层的含义：一种知识工程。把隐藏在代码、文档和人脑中的业务规则变成结构化的、AI 能理解的规格说明。

从数据到业务，本体的疆域扩大了一圈。如果 AI 不只是在屏幕后面出主意，而是要走进物理世界呢？

当本体指的是物理躯体本身

机器人的本体

在另一个完全不同的领域，"本体"有着更字面的含义——不是数据架构，而是物理实体本身。

做具身智能（让机器人拥有智能）的公司分成了两个阵营。一个叫"大脑公司"——OpenAI、Google DeepMind、NVIDIA 这些——它们更关心算法和智能本身，倾向于用通用硬件来验证自己的"大脑"够不够聪明。另一个叫"本体公司"——小米、宇树、智元——它们自己造机器人，早期主要靠自有硬件采集数据。[4]

有意思的是"本体无关数据"这个概念。做机器人的数据分三层：最顶层是用真实机器人遥操作采集的数据，最准但最贵；中间是物理引擎生成的仿真数据；底层是互联网上的人类视频数据。底层数据之所以有价值，恰恰因为它是本体无关的——不管机器人的手长什么样、有几个手指，人类抓取杯子的动作模式是可以泛化的。把人类当成一种特殊的"机器人"来采集数据，反而能帮模型建立跨本体的泛化认知。[4]

Steve（谢陈），一位具身智能数据产业的观察者，说了一句话："具身智能这件碎事，如果没有金字塔底下的仿真和人类数据，通用智能就出不来。"

具身智能领域追求的，恰恰是一种"反本体"的本体——通过超越具体物理形态的数据，让 AI 理解物理世界的通用规则。这跟 Palantir 用通用底层存储 + 灵活语义层的思路异曲同工，只不过 Palantir 超越的是数据库表结构，而机器人公司超越的是物理躯体。

数据、业务、物理躯体——本体的疆域一路扩大。但还有一个维度，比这些都棘手。

最难的一层：价值观本身就是一种本体

哲学家走进了实验室

2026 年，剑桥大学学者 Henry Shevlin 宣布加入 Google DeepMind，职位名称直接写的是"Philosopher"。这条推文被浏览了超过 160 万次。[5]

在全球头部 AI 实验室设全职哲学家岗位，这是第一次。但 Anthropic 早就有了类似角色。哲学家 Amanda Askell 在那里领导一个叫"人格对齐团队"的部门。《华尔街日报》说她的工作是"教 Claude 如何成为一个好的存在"，《纽约客》则说她负责监督 Claude 的"灵魂"。[5]

程序员试图给 AI 设定"价值观"时，发现了一个让人类文明尴尬了几千年的问题：我们从来没有标准答案。该遵循功利主义的"最大多数人的最大幸福"？还是康德式的绝对意志？还是某种契约论？这些问题没法通过调参解决。

FT 中文网专栏作家陈白把这叫作从"工具论"到"本体论"的时代转折。在工具论时代，技术只是工具，用错了是人的责任。在本体论时代，AI 开始参与定义什么是好的、什么是对的、什么值得追求——它不再只是工具，而是一个有"存在方式"的东西。

陈白的判断是：未来商业竞争不再仅仅是算力与资本的较量，而是价值框架与规则话语权的较量。[5]

这是本体最深的一层：价值观本身，就是一种本体。让 AI 理解什么是对错，比让它理解任何数据结构都难。

从亚里士多德到你的工位

一位独立开发者把本体论用在了电商内容生成上。他把品牌、产品、卖点、用户画像全部建模成图数据库中的节点和关系，让 AI 在结构化的事实之上生成内容，而不是凭空编造。他说，这解决了"同一个问题 A 回答不同于 B"的不确定性问题——以前靠资深运营的经验，现在靠图谱。[6]

Palantir 二十年前给五角大楼建的 Ontology，现在变成了金融 AI 的确定性基础设施、电信运营商的 AI Native 架构、电商内容工厂的知识底座、机器人公司的跨本体泛化数据。

而 DeepMind 招聘哲学家这件事说明，有些公司已经意识到：光给 AI 建本体不够，还得给 AI 建价值观。

回到亚里士多德。他问的是"存在是什么"。两千三百年后，我们还在问同一个问题，只是形式变了：我们该怎么告诉 AI，这个世界是什么样的？

如果你不告诉它，它就会自己编一个。而它编的那个版本，往往看起来什么都对，但你一眼就知道"不对"。那个"不对"的感觉，就是本体缺失的症状。而本体缺失的代价正在指数级上升——因为 AI 正在越来越多地替你做决策、替你写东西、替你的客户回答问题。

你的经验要么被你自己提炼成可审计的本体，要么被 AI 自己编一个出来。而它编的那个版本，永远没有你理解得深。

Kepler 在金融领域建了专有本体论，亚信在电信领域建了三驾马车架构。它们做的是同一件事：在 AI 到来之前，先把"这个世界的规则是什么"这个问题回答清楚。

谁先回答清楚，谁就拥有护城河。

参考资料

[1] 晚点LatePost，"OpenAI、Anthropic都开始押注FDE，FDE才是Agent时代的PMF范式？"，2026年5月。https://mp.weixin.qq.com/s/8oUv5H9qvjpq_-aCiJ9f6A

[2] Anthropic Blog，"How Kepler built verifiable AI for financial services with Claude"，2026年4月。https://www.anthropic.com/customers/kepler

[3] 亚信科技首席架构师朱军，"AI原生应用范式与三驾马车架构解析"，阿里云2026峰会 AI 编程专场，2026年5月。

[4] Steve（谢陈），AI 与机器人数据产业综述，社群内部分享，2026年。

[5] 陈白，"谷歌招聘哲学家背后：科技公司的角色正在发生巨变"，FT中文网，2026年5月7日。https://mp.weixin.qq.com/s/fAShBZZ1NK775cKZd4iXBg

[6] Lime 开发者，"AI桌面端产品架构与开发实践分享"，团队内部分享，2026年5月。