大概两年前,我开始认真折腾知识管理。
Notion、Obsidian、Roam Research、飞书知识库……全试过。一开始特别有成就感——读一篇文章,记一段笔记,觉得自己离"建立知识体系"又近了一步。
半年后打开 Obsidian,发现笔记库里有 847 篇文档。
其中大概 600 篇,我点开之后完全想不起来当时为什么存。
这就是大多数知识库的结局:存的时候很爽,用的时候很慌,最后变成一个电子垃圾堆。
直到我把笔记库当成代码仓库来"编译"。
这个思路救了我的知识库。今天把它摊开讲,不藏私。
核心就一条:知识不是存出来的,是编译出来的
大多数人的知识库是这么运作的:
读文章 → 复制粘贴 → 存进去 → 完事。
这套流程有一个根本问题:原始素材堆在那里,不会自动变成你能用的知识。
代码仓库是怎么工作的?写代码 → 提交 → CI 跑一遍 → 产出可执行文件。
知识库也应该这样。原始素材是"原料",经过 Claude 处理之后的摘要、沉淀的思考,才是"编译产物"。
所以我给笔记库定了一条铁律:
**原始素材永远不变。知识是编译出来的,不是堆出来的。**
三层目录,一个都不能多
我的 Obsidian 仓库里只有三个文件夹:
原料/ ← 只读,Claude 绝对不能改这里的东西 摘要/ ← Claude 结构化编译后的产物 沉淀/ ← 每次 Query 高质量回答的落文件原料/ 是我的原始输入——公众号文章、论文、播客笔记、突发奇想的碎碎念。放进去之后,不动。
摘要/ 是 Claude 的编译产物。读一篇长文,我会先和它聊 10 分钟,挖出核心观点,然后让它写一段 200 字的摘要存进去。不是翻译,是消化。
沉淀/ 是我真正在乎的东西。每次问出一个有价值的问题,我会让 Claude 把答案存成文件放这里。探索的结果才不会消失在聊天框里。
两个元文件,是整个系统的控制塔
光有目录不够,Claude 需要上下文才能真正高效工作。我放了三个元文件,各有各的功能。
CLAUDE.md:最高宪法
这是最重要的一个文件,放在仓库根目录。
里面写清楚:我是什么人、目录结构是什么规范、日常工作流是什么要求。每次开一个新会话,我第一件事就是让 Claude 把 CLAUDE.md 读一遍。
效果立竿见影——Claude 不再把你当普通用户,而是当成一个在某个项目里有上下文的人。它开始理解你的术语、你的偏好、你的知识边界。
index.md:全局目录
每篇笔记加一行 TLDR(Too Long Didn't Read,一句话总结),汇总到 index.md。
Claude 检索信息的时候,先扫一眼 index,决定要不要读原文。这一个小动作,能省下大量 Token——不是开玩笑的,我统计过,用了 index 之后单次 Query 的 Token 消耗大概降了 40%。
log.md:操作日志
只增不减,格式统一:## ingest | 标题 或者 ## query | 关键词。
这个文件看起来不起眼,但它的价值是让 Claude 知道仓库里最近发生了什么。下次它回答问题的时候,会自动带上"你最近在关注什么"这个上下文。
三个关键动作,让日常运转起来
架构搭好了,关键在日常。
Ingest:一次只处理一篇
每天我会挑一篇文章,丢进原料/,然后和 Claude 讨论它的核心 Takeaway。
重点不是总结文章内容——那个 AI 能做,比你做得还好。重点是问自己一个问题:这篇东西跟我有什么关系?
只有回答了这个问题,知识才会开始跟你已有的认知产生连接。不然读再多,都是在消费信息,不是建构知识。
讨论完,让 Claude 写摘要,更新 index.md。一篇一篇来,不贪多。
Query:让答案落地
这是大多数人最容易忽略的一步。
你问 Claude 一个好问题,它给了一个好答案——然后呢?聊天框关掉,答案没了,下次想用还得重新问。
我的做法:但凡这个答案我觉得有价值,立刻存到沉淀/去。
格式大概是:
文件名:{主题}-{日期} 内容:核心结论 + 我的理解 + 可能的行动项探索的结果不消失在聊天框里——这是区分"学了很多"和"真的懂了很多"的关键。
Lint:定期做健康检查
知识库用久了,总会出现两种问题:
一是过时——半年前记下的判断,现在已经有新证据推翻了。
二是矛盾——两篇笔记里的观点在打架。
我不让 Claude 默默覆盖旧内容。我的要求是:发现问题就标注出来,打上 ⚠️ 过时 或 ⚠️ 矛盾 的标签,让我来确认怎么合并。
AI 的本性是讨好你,你说啥它都点头。我要的不是讨好,是准确。
三条底线,防止知识库变成幻觉堆
这是最后一道防线,也是最重要的。
第一条:重要断言必须有来源链接。
不是"据研究显示",而是"据斯坦福 2024 年发布的 XXX 报告"。知识库里任何超过常识判断的结论,必须能追溯到原始出处。没有链接的断言,时间久了就是 AI 的幻觉。
第二条:新旧冲突,报 diff,不覆盖。
你半年前觉得 X 是对的,现在觉得 Y 是对的——这两个不能悄悄合并成一个。Claude 要做的是把 diff 报出来,让你决定保留哪个,或者两个都留着当"不同阶段的认知"。
第三条:区分"原文事实"和"推论"。
原文事实:作者说了什么。
推论:我从这段话里读出了什么。
这两样东西放在一起,但性质完全不同。混在一起,三个月后你自己都分不清哪些是你读到的,哪些是你想当然的。
把这些写进 CLAUDE.md,让 AI 在每次工作的时候都知道边界在哪——知识库才不会在几个月后变成一堆 AI 幻觉的堆积。
说白了,这套方法的核心就一句话:
把你的笔记软件,当成一个需要维护的代码仓库。
有规范,有版本,有编译,有健康检查。
你不需要存很多知识。你需要让知识在你的脑子里和笔记库里,同时保持活性。
能用的知识,才叫知识。能检索的知识,才算真的属于你。
夜雨聆风