AI 时代的文档新标准: OKF(开放知识格式)-夜雨聆风

AI 时代的文档新标准: OKF(开放知识格式)

这么说吧, OKF 就是我想要的, 知识的整理, Agent 在使用过程中信息的整理. 也就是我在这篇文档中提到的: 《德说-第488期, 不会自我进化的数据库都将被淘汰》

只听不看, 欢迎订阅视频号:

OKF 这个格式的诞生，直接受到了 Andrej Karpathy 提出的 “LLM Wiki”（大语言模型维基）概念的启发.

Karpathy的理念：他在2026年4月提出，可以让AI大模型（LLM）在完成任务的过程中，自动维护一个结构化的、由Markdown文件构成的“维基百科”作为“草稿本”。这个知识库可以不断更新和积累，供模型自己或其它模型在未来的任务中直接调用，从而避免每次都要重新检索和推理，大大提高效.

OKF v0.1 的核心规则其实很短：把你所有的知识（指标、表格、API、剧本、流程、系统、想法） 每个东西写一个 Markdown 文件，文件开头用 YAML 写明它是什么（type: Metric 之类），文件之间用相对路径互相链接，引用要用编号格式指向原始来源。

翻译成人话就是： 把企业里散落的知识，从”Word 在共享盘 / Confluence 在 wiki / 表在 Excel”统统换成”一堆互相链接的 Markdown 文件，托管在 Git 仓库里” 。

这件事的本质不是”格式升级”，而是让 AI Agent 能像 GitHub 读代码一样读你公司的知识。每一份 Markdown 都有结构化元数据、有明确的链接关系、有引用来源，AI 拿过去就能直接用，不用再做一堆”清洗、切片、嵌入、检索”的体力活。

我看到这里的时候，第一反应是： 这不就是把 1995 年”Linus 用文本文件和链接管理整个 Linux 内核源码”的思路，平移到企业知识上吗？ 是的，你没听错，就是回到”一切都是文本文件 + 链接”的朴素年代。但这一次让 AI 当工人，替人类维护这些链接。

从一个被 RAG 坑过的工程师说起

我有个朋友，过去两年给 5 家中型企业部署过 RAG 系统，踩过的最大一次坑是某律所 200GB 法律文档上线后准确率从 70% 跌到 35%。最后查出来是合同段落切碎后，术语链断裂了——合同里”见 §3.2″这种互引关系被向量检索全切散了。

他看到 OKF 的反应是：” 这不就是把运行时检索的活儿，前移到维护期干吗？ “

传统 RAG 的流程是：你问问题时，系统把文档切片、嵌入向量库、检索 top-k 段落、塞给大模型合成回答。每次都要重跑一遍，而且喂给模型的永远是碎片。

OKF 的思路反过来：原始素材入库的时候就让大模型消化、重写、合并成一个互相链接的 Markdown 树，运行时只剩”导航 + 摘录”。

关键差异在中间的”编译步骤”从运行时挪到了维护期。这位工程师的判断是：RAG 优化派相信”运行时能算清楚”，OKF 派认为”运行时算不清楚，必须预先消化”。 这两派对未来的赌注完全不同。

但他同时提醒我三个前提条件 ——

第一，LLM 维护 Markdown 树的质量必须稳定可靠。Karpathy 那个 Gist 是 5000 个 Star 的个人级方案，企业是几百万份文档，量级差太多。

第二，企业愿意把知识资产放回 Git 仓库，这涉及权限、审计、合规、备份、离职交接的全套治理重写，对习惯了”上传到 Confluence 完事”的组织是巨大迁移成本。

第三，超大规模（>10 万文档）的可扩展性，Karpathy 没给企业级的证据。

如果这三个条件都不成立，OKF 在企业内部会崩。但反过来说——他经手过的那 5 家企业里，至少有 2 家（产品手册密集、政策更新频繁的制造业）的痛点，确实就是 RAG 跑不准。OKF 思路在那两家是值得试的。

从一个卡片盒老玩家的哲学视角看 OKF

另一个朋友用 Niklas Luhmann 的卡片盒笔记法管了 1.2 万张卡片 8 年。他读完 Karpathy 那个 Gist 后沉默了很久，跟我说了一句挺重的话：” Luhmann 一辈子写了 9 万张卡片，最后 30 年的 70 多本书几乎都能在卡片盒里找到种子——他每写一张新卡片，必须先重读相邻卡片，再决定编号。’手动编号’这个动作本身就是思考过程。OKF 把’写卡片’和’决定关系’全部外包给 AI，到底是解放了我们，还是剥夺了我们思考时那种把思想压进卡片的认知动作？ “

这是更深一层的问题。Markdown 适合装”陈述性知识”（事实、定义、流程），但装不下”过程性知识”（经验、直觉、判断）——后者天然是模糊的、矛盾的、依赖语境的。如果 OKF 只能装前者，它就只是 Confluence 的 Markdown 替代品，不是革命。

但他也承认一个事实：双链笔记（Roam、Obsidian）用户平均坚持 6 个月后就放弃了”主动维护链接”的行为，转为纯 Markdown 笔记。这说明手动维护链接在规模化后真的不可持续。OKF 让 AI 工人接管这件事，至少在”链接维护”这个痛点上是对的。

他的结论是——对独立知识工作者最值得（你终于可以把时间花在”决定卡片之间的关系策略”上，而不是机械维护），对纯哲学/人文研究者警惕（可能让你丧失”边写边想”的深度认知训练）。OKF 解放的，是那些写作时不需要”写卡片”这个认知动作的人。

OKF 不是”新的革命”，而是 “LLM 工人接管链接维护后的双链笔记” —— 这件事 Karpathy 4 月份那个 Gist 已经说清楚了，OKF v0.1 是把它工程化、规范化。