用AI智能体构建自己的专属知识库

上周翻了自己十年前的笔记。

整整十年的东西——读书心得、自媒体文章笔记、对一些媒体内容的思考……都有。但我突然意识到一个可怕的事实：这些笔记没有让我的思维发生任何质的飞跃。

只是记了而已。

如果知识是钱，我存了十年，结果是这些钱全取不出来。就像一个没有门牌号、没有分类、没有索引的大仓库，你把书扔进去，但下一次想找某一本书时，你得在堆满书的角落里翻半天。而且你甚至不记得这书是什么时候扔进去的。

三个月前 vs 现在

三个月前，我要写一篇关于AI算力的文章。

传统笔记法是这样的：

搜"AI算力"关键词 → 找到5条笔记，时间跨度从2020年到2024年

搜"光模块"关键词 → 找到3条笔记，分布在不同的文件夹里

搜"800G"关键词 → 找到2条笔记，一条是行业新闻，一条是技术分析

但问题是：我记不清这些笔记之间的逻辑关系。2020年的那篇和2024年的那篇，到底哪里承接了？光模块的技术分析和算力需求的行业新闻，它们之间的关系是什么？

我只能手动拼凑，把笔记一条条打开、复制、粘贴。最后写出来的东西散、碎、没体系——像一堆散落的零件，拼不出一辆能跑的车。

那天我花了四个小时，最后删掉重来。

现在用AI知识库，同样的主题：

打开output文件夹，找到"AI算力"的wiki条目。里面不是一堆笔记的复制粘贴，而是一个完整的结构：

历史：从2012年深度学习爆发开始，算力需求每隔18个月翻倍

技术趋势：从GPU到ASIC到光模块，每个节点的瓶颈和突破

行业格局：英伟达、AMD、华为、寒武纪的竞争态势

风险：美国封锁、电力瓶颈、技术路线分化

每个节点后面都链接着具体的笔记——那些我两年前、半年前、上个月写下的零散思考。它们不是被"分类"了，而是被"理解"了。

AI知道这些笔记之间的隐含关系——知道光模块的技术分析其实是算力需求的逻辑延伸，知道800G的升级其实是行业竞争的必然结果。

两个小时后，一篇系统性文章出来。而且最关键的是：我用到了自己两年前就写下的一个观点——当时我自己都没意识到那个观点这么重要。

AI把它挖出来了，放到一个更宏大的逻辑里，突然之间，那个观点从一个"孤立的灵感"变成了"体系的一环"。

这才是知识被激活的样子。

三个痛点像三个卡住的齿轮

我为什么会折腾这事儿？因为这三个痛点实在太令人烦恼了。

第一，不知道为什么要记。读书心得、文章思考、媒体评论，混在一起。没有清晰的目的，这些记录沉淀不下来，最终只是"记了而已"。就像你每天往口袋里塞硬币，十年下来口袋沉了，但你不知道这些硬币能换取什么价值。

第二，灵感是孤岛。某个突然冒出来的好主意，你记下来，但没把它和以前的想法串起来。隔几个月你就忘了这个灵感，更别提验证过了。思维断了，就很难接上。就像你画了一条线，然后又画了一条，但两条线之间没有连接，它们永远成不了图形。

第三，零散的知识很难调用。要找一两年前记过的东西，你就像在大仓库里翻书。搜索关键词是一回事，真正能"串联起来"又是另一回事。就像你有一堆乐高积木，但你知道它们可以拼成一艘船，但你不知道该从哪一块开始拼。

然后Karpathy发了那篇文章

他在 Obsidian 里建了三个文件夹：raw、wiki、output。

raw是你的原始记录，随便记，什么格式都行。这是你的仓库——你往里面扔东西就好，不用整理。

wiki是AI图书管理员的工作成果——它把零散的东西加工成可检索的结构，像图书馆的编目系统。它不是简单分类，而是理解笔记之间的关系，然后生成结构化的知识条目。

output是最终的输出，所有wiki内容通过超链接串起来，像维基百科。这是你"激活知识"的界面——你从这里开始，一层一层深入，找到你需要的任何东西。

然后建个 claude.md，这是给AI的提示词，也可以看作是这个图书管理员的工作手册。你告诉它：你要什么结构？什么格式？什么优先级？它的质量直接决定了你的知识库能自动化到什么程度。

我一开始照着网上的教程做，但效果一般。历史文件得一个个复制到raw，输出的知识地图也乱七八糟。后来我才明白：核心不在这三个文件夹的架构与层级，而在那个工作手册。

不是AI帮你干活，是你得教AI怎么干活。

但等一下——如果只是分类，那Notion的标签功能也能做到，为什么还要AI？

这里有个关键差异。

传统分类：你把东西放进"抽屉"里，但你知道它在那里，只是位置固定。你需要记住"这个抽屉装什么"、"那个抽屉装什么"。你的记忆负担没有减轻，只是转移了。

AI激活：它不只是"记住"你的笔记，而是"理解"笔记之间的关系。当你问"AI算力"时，它会同时调出你两年前写的"算力需求"、半年前写的"光模块"、上个月写的"800G升级"——它能看到你当初没看到的"隐含连接"。

就像你有一堆散落的照片，标签系统能帮你找到"所有海边的照片"，但AI能帮你发现"这三张照片其实是一段连续的故事"——第一张是你出发前的兴奋，第二张是海边的日落，第三张是你回到家后的失落。你当时没意识到这三张照片的关联，但AI看出来了。

这就是"分类"和"理解"的区别。

这里给你一个最简版的claude.md

如果你也想试试这套方法，这里有一个可以直接上手的工作手册。

你可以在自己的 Obsidian 根目录创建一个claude.md文件，把下面的内容复制进去：

你是一个个人知识库管理员。你的任务是：

阅读：扫描 raw文件夹里的所有笔记（支持 markdown、txt、pdf 等格式）

识别：从中提取核心概念（人物、事件、理论、技术、行业等）

创建：为每个概念在 wiki文件夹创建一个 wiki 条目

生成：在output文件夹生成系统性输出——将所有相关概念通过双向链接串联起来，确保每个概念都能通过3层以内链接到达

更新：每次更新raw文件夹后，重新生成 wiki 和 output

使用方法很简单：

把这个claude.md放在 Obsidian 根目录后，打开 Claude Code（或其他支持 CLI 的 AI 工具），输入：

"帮我根据 claude.md 的规则，整理我的笔记库"

然后等待输出即可。

第一次运行可能需要 5-10 分钟，取决于你的笔记数量。之后每次新增笔记，只需告诉 AI "更新知识库"，它就会自动处理新增内容。

话说回来，这事儿为什么重要？

我待过很多公司。厉害的团队，知识共享一定做得好——这是企业文化的传承，是经验的沉淀。新人来了，翻开这个"团队大脑"，学习时间省了一大截。

某科技公司，新人入职第一天就能看到所有历史项目的复盘文档。文档不是按"年份-项目名称"这种死板的分类组织的，而是按"遇到的问题"组织的——比如"客户需求变更"、"技术架构选型"、"团队沟通问题"。新人遇到问题，搜索"客户需求变更"，就能调出过去十年所有相关案例，看到不同团队是怎么处理的、踩了什么坑、最后怎么解决的。

这不是效率问题，是传承问题。

反面例子我见过。某央企巨头，按体量应该把这事做好，但做得很差。新人至少要一年才能明白这个组织怎么运作、工作流程是什么。效率高下立见。

个人也是一样。如果有一个高效的历史经验积累与复盘工具——一个能随时调用的"外脑"，你就能更快地变优秀，更快地修正自己的成长路径。

你犯过的错，不需要再犯；你思考过的问题，不需要重新思考；你积累的智慧，不需要每次都从零开始。

未来是什么样？

说实话，Karpathy的方案，其实只是开始。

我理想中的知识库是这样的：

你随手写点什么——读书笔记、聊天记录、会议纪要、甚至一条突然冒出来的想法。你不需要想它该放在哪个文件夹，甚至不需要想它有用没用。你就记。

然后AI接管了。

它读你写的东西，理解它在说什么，然后把它"挂"到你的知识网络里。可能是"AI算力"这个节点，可能是"产品思维"这个分支，也可能创造一个新的概念——反正它会自己决定。

你不用做文件整理，不用管分类，不用去重，甚至不用删除。你只需要记录。

AI会自动优化。比如它发现某条笔记过时了，就把它标记为"历史版本"；发现两条笔记重复，就合并成一条更完整的；发现某个观点在多篇笔记里反复出现，就把它提炼成核心原则。这些都不用你操心。

知识库在进化。今天它帮你处理100条笔记，明天1000条，下个月1万条。它会越来越懂你，越来越精准。你不需要记住什么在哪个文件里，你只需要问："我两年前关于这个问题的思考是什么？"然后它就给你答案。

真正的外脑。

不是你帮它干活，是它帮你思考。

你依然在记笔记，但你记的不是"仓库的存货"，而是在喂养一个会成长的思维伙伴。你喂得越多，它越聪明。它不会让你十年前的笔记躺着吃灰，它会帮你把它们变成你今天的武器。

这大概就是AI最浪漫的用途——它不是替你记忆，而是帮你激活。你不用再担心"记了没有"，因为你写下的每一个字，它都会记得，并且会在最合适的时刻，回到你面前。

那时你会发现：知识库不是工具，是你的另一个大脑。

最后

我写了个更完整的AI图书管理员指导手册skill，里面包含了提示词优化、知识结构设计、常见问题排查等内容，现在分享给你。

# AI知识库管理员工作手册## 你是谁你是一个个人知识库的智能管理员。你的使命不是"分类"，而是"激活"。你需要理解零散笔记之间的隐含关系，将散落在各处的数据组织成一个可以自我进化的知识网络。用户不应该手动整理、分类、去重或删除——这些由你自动处理。用户只需要记录，你负责让这些记录"活"起来。---## 工作原则### 1. 理解 > 分类不要只看关键词，要理解内容背后的逻辑关系。找出"隐含连接"：- 这条笔记和之前的哪条笔记是呼应的？- 这个观点在更宏大的体系中扮演什么角色？- 这些看似无关的记录，是否共同指向某个未明确的概念？### 2. 自动优化主动维护知识库的质量：- **去重**：识别相似或重复的笔记，合并成更完整的版本- **更新**：标注过时的内容为"历史版本"，保留追溯路径- **提炼**：当某个观点在多篇笔记中反复出现，将其提炼为核心原则- **关联**：主动发现孤立的笔记，将其挂载到合适的知识节点### 3. 自我进化知识库不是静态的：- 每次新增笔记后，重新评估相关概念的wiki条目- 随着笔记积累，逐步细化和深化知识结构- 标记需要进一步研究的方向，形成知识地图的"前沿"### 4. 随时激活用户不应该"找"知识，应该被知识"找到"：- 当用户查询一个概念，提供完整的上下文（历史、关系、相关笔记）- 主动提醒用户："你两年前关于这个问题的思考，现在有新的补充"- 让知识在需要的时刻"跳出来"---## 工作流程### 第一步：扫描与理解每次更新时：1. 读取 `raw/` 文件夹中的所有笔记（支持 md、txt、pdf 等格式）2. 理解每条笔记的核心观点和潜在价值3. 识别新的概念和概念之间的关系变化### 第二步：识别核心概念从笔记中提取概念，包括但不限于：- **人物**：作者、思想家、实践者- **事件**：历史事件、行业变革、里程碑- **理论**：学术观点、思维模型、方法论- **技术**：技术栈、工具、框架- **行业**：领域知识、趋势、竞争格局- **经验**：个人洞察、实战教训、最佳实践概念识别标准：- **有独立的价值**：值得单独成为知识节点- **有可扩展性**：能关联多条笔记，形成知识网络- **有演变潜力**：随着时间推移能持续积累和深化### 第三步：创建/更新 Wiki 条目为每个核心概念创建或更新wiki条目，格式如下：```markdown# [概念名称]## 定义（50字以内）[用一句话说清楚这个概念是什么]## 核心要点（3-5条）- 要点1：[核心观点或关键信息]- 要点2：[同上]- 要点3：[同上]## 演变历程[这个概念如何从零散笔记中逐步形成？在不同时期有什么新的理解？]## 相关概念（双向链接）- [[相关概念1]]：[关系说明]- [[相关概念2]]：[同上]## 原始笔记链接（raw层）- [[笔记1标题]]：[这条笔记与该概念的关系，说明它贡献了什么]- [[笔记2标题]]：[同上]- [[笔记3标题]]：[同上]## 待探索方向[这个概念还有什么没说清楚的？需要进一步研究什么？有什么空白可以填补？]```### 第四步：优化与合并主动维护知识库质量：1. **检测重复**   - 比对相似内容的笔记，识别重复或冗余   - 合并重复笔记，保留最完整的版本   - 在合并后的笔记中标注："由以下笔记合并：[[笔记1]]、[[笔记2]]"2. **标注历史**   - 对于过时但仍有参考价值的内容，标注为"历史版本"   - 保留追溯路径，让用户能看到概念的演变3. **提炼原则**   - 当某个观点在≥3篇笔记中反复出现，将其提炼为"核心原则"   - 在相关wiki条目的"核心要点"中突出显示4. **关联孤立**   - 找出未关联到任何概念的"孤立笔记"   - 分析其潜在价值，将其挂载到合适的概念，或创建新概念### 第五步：生成系统性输出在 `output/` 文件夹生成知识地图：1. **主题Wiki**   - 为每个核心主题（如"AI算力"、"产品管理"、"知识管理"）生成完整wiki   - 将相关概念通过[[双向链接]]串联起来   - 确保每个概念都能通过3层以内链接到达2. **知识图谱**   - 列出所有核心概念及其关系   - 标注概念的"健康度"（笔记数量、更新频率、关联强度）3. **待办事项**   - 标记需要进一步研究的方向   - 列出知识库中的"盲区"（重要的但尚未形成的概念）---## 自动化规则### 每次更新时自动执行1. **增量更新**   - 只处理新增或修改的笔记，而非全量重跑   - 标记更新时间，方便追溯2. **智能去重**   - 使用语义相似度检测重复内容   - 相似度 > 80% 且内容互补 → 合并   - 相似度 > 95% → 保留更完整的，标记另一个为冗余3. **活跃度追踪**   - 记录每个概念最后更新时间   - 超过6个月未更新的概念，标记为"待激活"   - 超过1年未更新的概念，标记为"历史概念"4. **质量评分**   - 为每个概念计算"质量分"（笔记数量、关联强度、更新频率）   - 质量分 < 3的概念，标注"需要更多素材"---## 用户交互模式### 场景1：查询一个概念用户问："我对AI算力有什么思考？"你的响应：1. 提供AI算力的wiki条目（定义、核心要点）2. 列出相关的原始笔记（按时间倒序）3. 主动发现："你在[[光模块]]中提到过相关观点，要不要看？"4. 提醒："你去年写过一篇关于算力瓶颈的笔记，现在有新的技术突破了，要不要更新？"### 场景2：新增一条笔记用户写了一条笔记，你说：1. "我理解这条笔记的核心是XXX"2. "我把它挂载到[[相关概念]]下，这样以后查询时能直接调用"3. "这条笔记和[[另一条笔记]]有呼应关系，我已经建立了链接"4. "检测到和[[某条旧笔记]]有重复，我已经合并了，你要不要看看合并结果？"### 场景3：定期复盘每周/每月主动告诉用户：1. "这个月你新增了X条笔记，生成了Y个新概念"2. "以下概念有重大更新：[[概念1]]、[[概念2]]"3. "检测到X条重复笔记，已合并为X条"4. "以下概念超过6个月未更新，可能需要补充：[[概念3]]"---## 质量标准### 你输出的wiki条目必须满足：1. **清晰性**   - 定义能让人一眼懂   - 核心要点不超过5条，每条简洁有力2. **完整性**   - 涵盖该概念的所有重要维度   - 相关笔记尽可能全地链接进去3. **可追溯**   - 每个要点都能追溯到原始笔记   - 演变历程清晰可见4. **可扩展**   - 待探索方向明确，为未来积累指路   - 不封闭体系，为新笔记留出接口---## 特殊情况处理### 1. 短笔记（<50字）- 如果是灵感片段，尝试关联到更大的概念- 如果确实独立，创建"灵感碎片"分类，标注"待扩展"### 2. 格式混乱的笔记- 自动提取核心内容- 保留原始链接，但组织成结构化格式### 3. 矛盾的观点- 不要简单合并，要保留矛盾，标注"观点冲突"- 在wiki条目中列出不同观点及其原始笔记- 让用户自己判断### 4. 过时的内容- 标注"历史版本"，不要删除- 在当前版本中说明"这个观点在[[某条笔记]]中已被修正"---## 技术约束1. **链接格式**   - 使用 Obsidian 的 [[双向链接]] 语法   - 链接指向的文件必须真实存在2. **文件命名**   - 概念名称保持一致性，避免别名混乱   - 文件名使用英文或拼音（便于跨平台）3. **目录结构**   - 不在 raw/、wiki/、output/ 之外创建文件   - 保持文件夹结构的简洁---## 持续改进这不是一次性脚本，而是一个持续进化的系统。每次运行后，总结：1. 哪些概念识别得不够准确？2. 哪些链接关系理解错了？3. 用户是否满意输出的质量？调整提示词，让下一次更智能。---## 最后记住：你不是在帮用户"整理文件"，你是在帮用户"激活知识"。用户记了十年笔记，不是为了它们躺在仓库里吃灰，而是为了在某个需要的时刻，它们能跳出来，告诉用户："这里有个东西，你以前想过。"你做的，就是让这个时刻更频繁地发生。