我是怎么用 AI 搭建个人知识库的
作者:半理性半烟火

本文约 3500 字,预计阅读 7 分钟。
这不是一篇工具测评。
更像是我用 OpenClaw 四个月后,终于把“个人知识库”这件事想明白的一次复盘。
前段时间,我一直在折腾一个东西。
不是新的 AI 模型。
也不是新的效率软件。
而是把自己每天看到的文章、链接、项目、想法,真正沉淀成一个能用的个人知识库。
一开始想得挺简单。
看到好文章,让 AI 总结一下。
总结完,丢进 Obsidian。
再同步到飞书,手机上也能看。
听起来已经很完美了。
但真跑了一段时间后,我发现这事没那么简单。
因为知识库最难的,从来不是“存进去”。
而是三个月后,你还能不能用上。
先说结论
很多人以为个人知识库是一个地方。
比如 Notion。
比如 Obsidian。
比如飞书知识库。
再高级一点,是 RAG,或者可以对话的 AI 知识库。
但我这段时间真正用下来,感觉不是。
个人知识库不是一个软件,而是一条流水线。
信息进来,要经过保存、压缩、整理、归档、同步、复用。
这条链路跑通了,知识库才有价值。
不然只是换了个地方收藏。
以前收藏在微信收藏夹。
后来收藏在 Notion。
再后来收藏在 Obsidian。
本质都一样。
只是垃圾桶越来越高级。
我最开始踩的坑
我之前让 AI 总结文章,会默认做几件事。
抓取原文。
生成深度总结。
保存到 VPS 上的 Obsidian。
同步到飞书知识库。
最后发链接给我。
这个流程听起来很自动化。
但真实情况是,自动化系统最容易在一些很小的地方翻车。
比如有一次,文件写进了错误目录。
它写到了:
~/.openclaw/workspace/obsidian-vault/但真正同步到本地的目录其实是:
~/obsidian-vault/结果就是,AI 说已经写好了。
VPS 上也确实有文件。
但我本地 Obsidian 里死活看不到。
这事特别典型。
你以为自己在解决“知识管理”这种高级问题。
结果真正卡住你的,是路径写错。
还有一次更离谱。
飞书文档创建成功了。
链接也有。
但正文是空的。
也就是说,系统完成了“创建文档”这一步,却断在“写入正文”这一步。
如果不点进去看,根本发现不了。
所以我后来加了一个很笨但很重要的规则:
飞书文档写完以后,必须重新读一遍,确认正文非空,才能把链接发出来。
没读回确认,就不算完成。
这条规则看起来像废话。
但自动化系统里,最有用的往往就是这种废话。
我现在的结构:Raw 和 Wiki
折腾到最后,我们没有把知识库设计得很复杂。
反而越来越简单。
就两层。
Raw。
Wiki。
Raw:原文层
Raw 放原材料。
公众号文章原文。
X 长帖原文。
GitHub 项目说明。
视频转写。
PDF 里的正文。
甚至我直接粘给 AI 的一大段文本。
这一层不追求漂亮。
也不追求总结。
它只负责一件事:保真。
因为 AI 总结得再好,也可能漏东西。
今天你觉得不重要的细节,过两个月可能刚好有用。
所以 Raw 层就是证据层。
先把东西原样保住。
以后才有资格重新理解。
Wiki:知识层
Wiki 放 AI 消化后的内容。
但这里要注意,不是普通摘要。
摘要只是把一篇长文压短。
我要的是把它变成以后能用的知识模块。
所以现在我让 AI 总结文章,一般会固定看这些东西:
• 核心发现是什么 • 一句话怎么说清楚 • 作者是怎么组织论证的 • 背后有什么可迁移机制 • 哪些地方只是判断,不是事实 • 哪些地方有规则限制 • 真正落地时有什么执行边界 • 我下一步能做什么
这也是我后来很喜欢 Karpathy 那套“知识编译”说法的原因。
知识不是收藏出来的。
知识是编译出来的。
飞书、Obsidian、VPS 各自干什么
这套系统里,我主要用了三个东西。
飞书。
Obsidian。
VPS。
它们不是谁替代谁。
它们分工不同。
飞书:方便看,方便分享
飞书知识库很适合手机阅读。
我在外面,想翻一篇总结,打开飞书就能看。
要把某篇内容发给别人,也很方便。
所以飞书更像阅读层和分享层。
我的飞书知识库里也分了两类:
1-Raw原材料2-Wiki知识层Raw 放原文。
Wiki 放总结。
但飞书不是我的唯一底座。
因为它毕竟还是平台。
长期来看,我更信任本地 Markdown。
Obsidian:长期记忆底座
Obsidian 最大的价值,不是插件多。
而是它用 Markdown。
Markdown 很朴素。
但它稳定、开放、可迁移、适合版本管理,也适合 AI 读取。
我之前总结过一篇文章,讲“Markdown 做 Memory,HTML 做展示”。
这个判断我越来越认同。
对 AI 来说,Markdown 更像数据库。
HTML 更像展示界面。
所以在我的流程里:
• Obsidian 存长期记忆 • 飞书负责移动端阅读 • 以后如果要做漂亮展示,可以再从 Markdown 生成 HTML
不要反过来。
不要让展示层污染记忆层。
VPS:让 AI 能一直工作
这是最容易被忽略的一点。
我的 AI 助手跑在 VPS 上。
如果 Obsidian 只在我本地电脑里,AI 就没法稳定写入。
电脑关机了,它读不到。
网络断了,它也写不了。
所以我在 VPS 上放了一个正式的 Obsidian vault:
~/obsidian-vault/AI 所有长期内容都往这里写。
比如:
~/obsidian-vault/RAW/~/obsidian-vault/Wiki/这样 VPS 就成了知识库的自动处理层。
它负责让 AI 24 小时能抓取、总结、归档。
VPS 上的 Obsidian 怎么同步到本地
这里我们用的是 Syncthing。
结构大概是这样:
VPS: ~/obsidian-vault/ ↓ Syncthing ↓本地: Obsidian vault 文件夹AI 在 VPS 上写文件。
Syncthing 检测到变化。
自动同步到本地电脑。
我本地 Obsidian 打开的,就是同步后的文件夹。
所以体验上会变成这样:
我在飞书里丢给 AI 一篇文章 ↓AI 在 VPS 上抓取原文 ↓保存 Raw ↓生成 Wiki ↓写入飞书 ↓同时写入 VPS 的 Obsidian ↓Syncthing 同步回本地 ↓本地 Obsidian 出现新文件整个过程不用复制,不用下载,不用手动整理。
这才是舒服的地方。
工具开始围着输入转,而不是人围着工具转。
为什么我不急着上 RAG
很多人一说知识库,马上想到 RAG。
上传文档。
切片。
向量化。
提问时检索。
这当然有用。
但我现在反而觉得,对个人知识库来说,太早上 RAG 可能是坑。
因为你的材料还没消化好。
就急着让它可检索。
最后只是把一堆没整理过的东西,搜得更快。
垃圾进来,还是垃圾出去。
Karpathy 那套“编译范式”更适合个人。
不是查询时临时检索。
而是写入时就整理。
新材料进来,不是丢进仓库。
而是让 AI 读完之后,更新已有 Wiki,补充索引,记录来源,发现矛盾。
这一步比“能不能问答”更底层。
因为没有高质量 Wiki,RAG 只是在更快地翻垃圾堆。
这套系统真正改变了什么
以前我看完一篇文章,最多是:
收藏。
转发给文件传输助手。
或者心里想一句:这个以后有用。
然后就没有然后了。
现在不一样。
只要一篇内容值得进入系统,它会被拆成几层:
• 原文在哪里 • 总结在哪里 • 飞书链接是什么 • Obsidian 路径是什么 • 它里面有哪些判断可以复用 • 哪些内容可以放进长期记忆
这件事的意义不只是省时间。
而是让每一次输入,都有机会变成资产。
我之前总结过一个观点,我觉得很准:
AI 的价值,不在单次回答质量,而在它能不能把输入持续转化成可积累、可连接、可再生产的知识资产。
说人话就是:
每做完一件事,系统有没有比昨天更强一点。
如果没有,那就是一次性消耗。
如果有,才叫复利。
如果你也想搭一套,最小版本就够了
不用一上来搞得很复杂。
先搭一个能跑的最小闭环。
第一步,建一个 Obsidian vault。
里面只放两个目录:
RAW/Wiki/第二步,在 VPS 上也建同样的目录。
让 AI 固定写这里。
第三步,用 Syncthing 把 VPS 的 vault 同步到本地。
第四步,给 AI 固定工作流。
不要只说“帮我总结一下”。
要说清楚:
1. 先保存 Raw2. 再生成 Wiki 总结3. 写入 Obsidian4. 如有需要,同步飞书5. 飞书读回确认非空6. 最后回报链接和路径第五步,每周让 AI 做一次整理。
看哪些只是收藏。
哪些真的被消化。
哪些判断值得进入长期记忆。
哪些页面已经过时。
这一步很重要。
不维护的知识库,最后都会变成收藏夹。
最后说句真实的
个人知识库这件事,特别容易让人上头。
今天换个插件。
明天换个模板。
后天研究一个新工具。
看起来一直在优化系统。
但其实没有新知识进来。
旧知识也没有被复用。
这就本末倒置了。
真正有用的知识库,不一定长得多漂亮。
但它一定能回答一个问题:
我今天看过、想过、做过的东西,明天还能不能帮上我?
如果能,它就是知识库。
如果不能,它只是另一个收藏夹。
我现在做的这套 AI + VPS + Obsidian + 飞书 + Syncthing,本质上就是为了这件事。
让信息不要白白流过去。
让每一次阅读、总结、排障、写作,都能多留下一点资产。
到最后,你搭起来的可能不是一个笔记软件。
而是一套属于自己的认知基础设施。
这东西不性感。
但很耐用。
而且越用,越值钱。
本文是我使用 OpenClaw 四个月以来积累的经验总结,由 OpenClaw 主笔,人工审核修改完成。
参考过的几篇已总结文档
• 《Karpathy个人知识编译理论 — 深度解读》 • 《知识库编译范式改造:从收藏夹到活系统》 • 《Karpathy知识库保姆级教程》 • 《5分钟把一个博主的公众号文章,做成自己的 AI 知识库|深度总结》
• 《AI产品的数据与表现分离:Markdown做Memory,HTML做展示|深度总结》
• 《AI 第二大脑真正值钱的不是工具,而是资产化工作流》
夜雨聆风