谷歌开源OKF——给AI Agent统一知识格式的野心有多大

Andrej Karpathy说过一句话："LLM不会无聊，不会忘记更新交叉引用，而且一次能修改15个文件。"——这就是为什么AI Agent需要一种专属的知识格式。

你有没有遇到过这个场景：

你搭了一个AI Agent，让它回答公司内部的业务问题。

数据表的Schema在BigQuery里，业务规则在Confluence wiki里，指标定义在仪表盘配置里，操作手册在共享网盘里。

Agent要回答一个问题，得从四个不同的地方拉信息，每个地方的格式都不一样。

这不是Agent能力不够，是知识本身就是碎片化的。

2026年6月12日，谷歌开源了OKF（Open Knowledge Format）——一个厂商中立的Markdown规范，专门解决这个问题。

今天这篇文章，把OKF从设计理念到文件格式到实际场景掰清楚——帮你判断这东西值不值得关注、值不值得用。

一、OKF是什么？一句话说清楚

OKF = 一个目录的Markdown文件 + YAML frontmatter，用来给AI Agent喂结构化的组织知识。

就这么简单。不需要专有SDK，不需要特殊平台，不需要数据库。

你能 cat 一个文件，就能读 OKF；你能 git clone 一个仓库，就能分发 OKF。

1.1 规范有多简洁？

OKF v0.1的完整规范放在GitHub上，一页纸就写完了。

核心规则只有三条：

每个文件必须有可解析的YAML frontmatter
frontmatter中只有一个必填字段：type
保留文件名index.md和log.md有特殊含义

1.2 一个完整的OKF文档长什么样

---type: BigQuery Tabletitle: Ordersdescription: 每个已完成的客户订单一行记录resource: https://console.cloud.google.com/bigquery?p=acme&amp;d=sales&amp;t=orderstags: [sales, revenue]timestamp: 2026-05-28T14:30:00Z---# Schema| Column      | Type   | Description                     ||-------------|--------|---------------------------------|| order_id    | STRING | 全局唯一订单标识符              || customer_id | STRING | 外键 → customers|# Joins与 customers 通过 customer_id 关联。

注意那个customers——这不只是一个链接，这是知识图谱的一条边。 Markdown链接就是概念之间的关系，不需要额外的关系定义语言。

二、Knowledge Bundle：知识打包成文件夹

OKF的核心概念是Knowledge Bundle——一个知识包，本质上就是一个文件夹。

sales/├── index.md                    # 入口：整个sales领域的概览├── datasets/│   ├── index.md                # 数据集目录│   └── orders_db.md            # orders数据库文档├── tables/│   ├── index.md                # 表目录│   ├── orders.md               # orders表详细文档│   └── customers.md            # customers表详细文档├── metrics/│   ├── index.md                # 指标目录│   └── weekly_active_users.md  # WAU指标定义└── log.md                      # 变更历史

2.1 路径即身份

文件路径就是知识的唯一ID——tables/orders.md就代表"orders表"这个概念。不需要额外的ID系统。

2.2 index.md是渐进式入口

每个目录的index.md列出该目录下有什么——Agent先读index.md了解全貌，再按需深入具体文件。

这就是渐进式披露（Progressive Disclosure）——不一次性灌入所有知识，而是让Agent按需探索。对Context Window极度友好。

2.3 可以用Git分发

Bundle本质是文件夹，可以：

打成tarball传输
放在Git仓库里版本控制
在GitHub上直接人类可读
被任何Agent无需适配地消费

三、OKF解决什么问题？

3.1 知识碎片化

每个组织的知识分散在N个地方：

数据仓库Schema在BigQuery/Snowflake
业务规则在Confluence/Notion
操作手册在Google Docs
指标定义在Looker/Grafana配置里
架构图在draw.io
代码规范在README里

每个Agent开发者都在独立解决同一个问题：怎么把这些碎片拼成Agent能用的上下文。

OKF说：别拼了，把所有知识统一成Markdown+YAML，Agent直接读。

3.2 知识锁定

现有的知识要么锁在Confluence的API里，要么锁在某个SaaS平台的专有格式里。换一个工具，知识就带不走。

OKF是纯文本。你换Agent框架、换LLM、换平台，知识格式不需要变。

3.3 上下文工程的基础设施

2026年的热词是Context Engineering——给Agent组装高质量的上下文。

MCP解决了Agent怎么执行（调API、查数据库）。

OKF解决了Agent拿什么思考（组织知识、业务规则、架构约束）。

MCP是手，OKF是脑子里的知识。 两者互补，不是竞争。

四、OKF vs 你已经知道的那些东西

4.1 OKF vs CLAUDE.md / AGENTS.md

CLAUDE.md是单文件或少量文件，给一个仓库的Agent写指令。

OKF是目录级的知识图谱，给整个组织的Agent提供知识。

不冲突。 CLAUDE.md可以引用OKF文件：

执行分析任务前，先读 /okf/sales/metrics/weekly_active_users.md

4.2 OKF vs RAG

RAG是运行时检索——Agent遇到问题，去向量数据库里搜相关文档。

OKF是预编纂的知识库——人类（或Agent）事先把知识整理好，Agent直接读。

区别在于：RAG检索回来的可能是"大概相关"的片段，OKF提供的是"经过整理的、有结构的、有交叉引用的"知识。

RAG解决"不知道有什么"，OKF解决"知道但很乱"。

4.3 OKF vs MCP

MCP
：Agent的工具层——怎么执行（调API、查数据库、发消息）
OKF
：Agent的知识层——拿什么思考（业务规则、数据结构、操作流程）

这两层是正交的。一个好的Agent既需要MCP连接工具，也需要OKF提供知识。

五、谷歌自己怎么用OKF？

谷歌同时发布了两个参考实现和三个示例Bundle：

5.1 BigQuery Enrichment Agent

这个Agent会自动遍历你的BigQuery数据集，为每个表和视图自动生成OKF文档——包括Schema描述、Join路径、引用来源。

你不需要手写OKF。 让Agent帮你写，你审核就行。

5.2 静态HTML可视化器

一个单文件的HTML页面（无后端），把OKF Bundle转换成可交互的知识图谱。

你可以在浏览器里看到所有概念之间的关系——哪些表和哪些指标相关、哪些字段是外键引用。数据不离开你的浏览器。

5.3 三个示例Bundle

GA4电商数据
：Google Analytics 4的电商事件Schema
Stack Overflow公开数据集
：问答数据的知识结构
Bitcoin公开数据集
：区块链数据的知识结构

想试手？直接clone下来看。

六、Karpathy的LLM Wiki哲学

OKF的设计哲学和Andrej Karpathy提出的"LLM Wiki"理念高度一致。

Karpathy的观察是：人类维护知识库（wiki）最终都会烂尾——更新太累、交叉引用容易忘、格式逐渐混乱。

但LLM不会：

不会无聊
——让它更新100个文件的交叉引用，它不会抱怨
不会遗忘
——修改了一个表名，它会自动更新所有引用这个表的文档
一次能改15个文件
——人类做不到的批量一致性修改，LLM轻松搞定

OKF就是把这个理念标准化了：让Agent来写、维护和消费组织知识，用一种Agent友好的格式。

七、OKF的局限和开放问题

别光说好的，说说问题。

7.1 知识冲突怎么办？

两个OKF文件对同一个指标的定义不一致——规范没说怎么处理。v0.2承诺会加入矛盾语义和信任层级。

7.2 静态知识会过期

OKF是静态的Markdown文件。数据库加了一列、业务规则改了——如果没人（或Agent）更新OKF文件，知识就过期了。

这就是为什么BigQuery Enrichment Agent很重要——它能自动化知识更新，而不是靠人记得去改。

7.3 谁来治理？

目前OKF发布在Google的GitHub组织下，12个Issue、2个PR。还没有独立的社区治理结构。

对比MCP已经被Linux Foundation接管——OKF在治理成熟度上差了一大截。这会影响其他厂商的采纳意愿。

7.4 会不会"又一个标准"？

——如果你懂这个梗的话。

Agent生态已经有MCP、A2A、AAMP、ACP……OKF会不会变成"又一个没人用的标准"？

谷歌的回答是：OKF运作在比这些标准更底层的位置——它不关心Agent怎么通信、怎么执行，只关心Agent读的知识长什么样。

八、对开发者意味着什么？

8.1 如果你在做Agent项目

现在就可以试。把你的业务知识整理成OKF格式的Markdown文件，放在Agent能读到的地方。即使OKF最终没成为标准，这种结构化的知识整理方式本身就有价值。

8.2 如果你在做企业AI平台

关注OKF和MCP的配合。MCP给Agent工具，OKF给Agent知识——工具+知识=有用的Agent。缺一不可。

8.3 如果你只是围观

记住一个趋势：AI Agent的竞争正在从"谁的模型更强"转向"谁的上下文更好"。

Context Engineering是2026年的主旋律。OKF就是这个趋势的产物——不是造更强的Agent，而是给现有Agent喂更好的知识。

写在最后

OKF v0.1简单到有些"无聊"——不就是Markdown文件加个YAML头吗？

但这恰恰是它的精妙之处。

伟大的标准都很无聊。 HTTP无聊吗？JSON无聊吗？Markdown本身无聊吗？正是因为足够简单、足够通用，它们才成为了基础设施。

OKF赌的是同一件事：最终胜出的知识格式，一定是最简单的那个。 不需要专有SDK、不需要数据库、不需要培训——cat一个文件就能读，git clone就能分发。

当然，v0.1还很早期，治理、冲突处理、社区建设都是未知数。但方向是对的——Agent需要的不是更多工具，而是更好的知识。

如果你做Agent项目，不妨试试把你的业务知识OKF化。最差的结果也不过是你多了一份整理好的Markdown文档。

我是老周，一个在架构领域摸爬滚打多年的技术人。如果这篇文章对你有帮助，欢迎点赞、在看、转发三连。关注「老周聊架构」，每周深度解读AI和架构的最新趋势。