从"堆文档"到"长知识":一文读懂 AI 时代的知识工程方法论
你有没有遇到过这样的场景?
员工问一句**”供应商入库需要哪些材料?”**,答案散落在 PDF、操作手册、邮件、聊天记录里,谁也找不齐;
CRM 里叫”客户”,财务系统里叫”往来单位”,运营那边又叫”商家”——三套系统各说各话;
去年更新的采购制度,和新规悄悄打架,没人发现,也没人更新……
听起来很熟悉?这就是今天大多数企业知识管理的真实处境。
我们花了大力气建知识库,结果却总是一个剧本:轰轰烈烈地建,悄无声息地烂尾。
为什么会这样?
━━━━━━━━━━━━━━━
一、传统知识管理,卡在了哪里?
一句话:它把宝全押在了”人工维护”上。
而人工整理文档、更新关联、检查一致性的成本,会随着知识量指数级增长。文档越多,维护越累,直到某一天彻底没人管。
具体来说,逃不开这四大困境:
① 重存储,轻检索文档堆积如山,找东西却只能靠文件名和记忆。
② 重形式,轻语义只盯着格式和分类,却忽略了概念本身的统一。同一个意思,在不同系统里叫不同的名字,永远打不通。
③ 重积累,轻应用知识躺在文档里、藏在专家脑子里,能查到,却很难真正”用起来”。
④ 重建设,轻维护建好之后没人维护,内容过时、自相矛盾,最后只能推倒重来。
这四个困境的根子是同一个:人,干不过知识爆炸的速度。

━━━━━━━━━━━━━━━
二、转折:大模型,给了知识工程一个新底座
2023 年之后,大语言模型(LLM)的突破,第一次让”自动化的知识工程”成为可能。
原因在于,大模型恰好带来了三项对症的能力:
- 语义理解
—— 让机器真正”读懂”文档; - 推理关联
—— 把散落的概念串成一张网; - 自主生成
—— 不只是检索,还能总结、补全、纠错。
有意思的是,这三项能力分别催生了四条技术路线,而它们最终又收敛成了同一套方法论。
━━━━━━━━━━━━━━━
三、四条技术路线:先记住这四个比喻
不必被术语吓到,每个技术都可以用一个比喻来理解:
🔹 RAG —— 让大模型”开卷考试”
回答问题前,先从企业知识库里检索相关内容,再喂给大模型生成答案。
一句话:与其让 AI”闭卷瞎猜”,不如让它”开卷作答”,而且每条答案都能标出来源。
它是知识工程的地基——门槛最低、见效最快,通常两周就能跑通一个最小可用版本。
🔸 Skills —— 从”知道”到”做到”
把专家的经验、操作流程、业务规则,封装成大模型可以调用的”能力单元”。
没有它,AI 只能”知道”;有了它,AI 才能”做到”。
比如”供应商评估”这种依赖老专家经验的事,可以固化成 Skill,自动化率能从 20% 提升到 80%。
🔹 Ontology(知识本体)—— 给知识系统立一部”宪法”
对企业里的核心概念、属性、关系做一次形式化的定义。
没有本体,系统”各说各话”;有了本体,系统”统一语言”。
它是整个体系的骨架,让检索、推理、执行都建立在同一套概念之上。
🔸 LLM Wiki —— 知识的”编译器”
这个理念来自 Karpathy 的一个比喻:
“你的文件是生食材。Wiki 是做好的菜。RAG 的问题是,每次饿了都要重新做一遍。”
LLM Wiki 把原始文档”编译”成结构化知识库——编译一次,永久受益,而且好的回答会自动存回去,越用越厚。
━━━━━━━━━━━━━━━
四、四代演进:不是替代,而是累积
把镜头拉远,知识工程其实已经走了四代:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
关键认知:四代不是”谁淘汰谁”,而是层层累积。
可解释性(一代)+结构化(二代)+理解力(三代)= 第四代的 Knowledge Harness。每一代都保留了上一代的优点,又长出了新能力。
━━━━━━━━━━━━━━━
五、核心:Knowledge Harness,一个会”自转”的闭环
终于说到重点。

Knowledge Harness(知识驾驭)方法的灵魂,是五个要素组成的一个顺时针闭环:
01 Compile 编译 —— 知识怎么产生?LLM 阅读原文档,自动生成结构化知识。
02 Reason 推理 —— 知识怎么用?不止于单篇问答,而是跨文档综合判断。
03 Execute 执行 —— 知识怎么落地?把知识固化为可运行的 Skills 动作,真正”做”出来。
04 Evolve 演化 —— 知识怎么不腐烂?好的结果自动写回,新知识自动纳入。
05 Lint 体检 —— 质量怎么保证?定期扫描矛盾、孤立、过时内容,相当于知识库的免疫系统。
编译 → 推理 → 执行 → 演化 → 体检 → 再编译……
每一轮循环,都让知识系统更强。
这就是它和传统 RAG 最根本的区别:RAG 是”用一次算一次”,而 Harness 是复利增长——越用越聪明。
它背后是三大范式转变:
- 隐式 → 显式
(Ontology 让经验看得见) - 静态 → 动态
(LLM Wiki 让知识会更新) - 检索 → 执行
(Skills 让知识能行动)
━━━━━━━━━━━━━━━
六、落地:我该从哪条路线开始?
别一上来就想建 Harness——那是终局,不是起点。先用三步给自己做个快速诊断:
第一步:数据量有多大?文档不到 10 万份 → 进入第二步;超过 10 万份 → 重点看语义关系是否复杂。
第二步:要不要固化专家经验?要 → Skills 优先;不要 → RAG 起步。
第三步:语义关系需要建模吗?要 → 本体优先;不要 → RAG+融合。
简单粗暴的判断方式:
-
文档不多、急着上线、主要做问答 —— 从 RAG 起步; -
有资深专家、经验急需固化 —— 从 Skills 起步; -
术语混乱、系统需要打通 —— 从本体起步。
核心原则只有一句:先解决最痛的问题,快速验证价值,再逐步扩展。
━━━━━━━━━━━━━━━
七、四条心态,比技术更重要
技术选型会变,但这四条原则不会过时:
1. 循序渐进,价值驱动从最痛的点切入,每个阶段都要能讲清”创造了什么业务价值”。
2. 技术融合,而非替代RAG、Skills、本体不是三选一,而是根据场景组合使用。
3. 人机协同,而非完全自动化初期以辅助为主,关键决策保留人工——先建立信任,再谈替代。
4. 持续迭代,小步快跑别追求一步到位。快速迭代、持续优化,才是知识系统活下去的方式。
━━━━━━━━━━━━━━━
写在最后
回到开头的那个问题:知识库为什么总是烂尾?
因为它从一开始就被当成了一个仓库——只管往里堆,不管会不会用、会不会长。
而 AI 时代的知识工程,目标是养一个会自己长大、自我修复的”知识生命体”。
也许今天的你,只需要一个能回答问题的 RAG;但当你理解了 Harness 这个终局,就会清楚——脚下的每一步,究竟该往哪里走。
知识,从来不是堆出来的,而是”长”出来的。
━━━━━━━━━━━━━━━
💬 觉得有用? 欢迎转发给同样被”知识库烂尾”困扰的同事。
🔔 关注我们,后续会继续拆解 RAG、Skills、本体建模的落地实操细节。
👇 留言区聊聊:你所在的企业,现在卡在四大困境的哪一环?
点击原文链接可以查看原文界面。(电脑打开链接,演示效果最佳)
夜雨聆风