上周翻了自己十年前的笔记。
整整十年的东西——读书心得、自媒体文章笔记、对一些媒体内容的思考……都有。但我突然意识到一个可怕的事实:这些笔记没有让我的思维发生任何质的飞跃。
只是记了而已。
如果知识是钱,我存了十年,结果是这些钱全取不出来。就像一个没有门牌号、没有分类、没有索引的大仓库,你把书扔进去,但下一次想找某一本书时,你得在堆满书的角落里翻半天。而且你甚至不记得这书是什么时候扔进去的。
三个月前 vs 现在
三个月前,我要写一篇关于AI算力的文章。
传统笔记法是这样的:
搜"AI算力"关键词 → 找到5条笔记,时间跨度从2020年到2024年
搜"光模块"关键词 → 找到3条笔记,分布在不同的文件夹里
搜"800G"关键词 → 找到2条笔记,一条是行业新闻,一条是技术分析
但问题是:我记不清这些笔记之间的逻辑关系。2020年的那篇和2024年的那篇,到底哪里承接了?光模块的技术分析和算力需求的行业新闻,它们之间的关系是什么?
我只能手动拼凑,把笔记一条条打开、复制、粘贴。最后写出来的东西散、碎、没体系——像一堆散落的零件,拼不出一辆能跑的车。
那天我花了四个小时,最后删掉重来。
现在用AI知识库,同样的主题:
打开output文件夹,找到"AI算力"的wiki条目。里面不是一堆笔记的复制粘贴,而是一个完整的结构:
历史:从2012年深度学习爆发开始,算力需求每隔18个月翻倍
技术趋势:从GPU到ASIC到光模块,每个节点的瓶颈和突破
行业格局:英伟达、AMD、华为、寒武纪的竞争态势
风险:美国封锁、电力瓶颈、技术路线分化
每个节点后面都链接着具体的笔记——那些我两年前、半年前、上个月写下的零散思考。它们不是被"分类"了,而是被"理解"了。
AI知道这些笔记之间的隐含关系——知道光模块的技术分析其实是算力需求的逻辑延伸,知道800G的升级其实是行业竞争的必然结果。
两个小时后,一篇系统性文章出来。而且最关键的是:我用到了自己两年前就写下的一个观点——当时我自己都没意识到那个观点这么重要。
AI把它挖出来了,放到一个更宏大的逻辑里,突然之间,那个观点从一个"孤立的灵感"变成了"体系的一环"。
这才是知识被激活的样子。
三个痛点像三个卡住的齿轮
我为什么会折腾这事儿?因为这三个痛点实在太令人烦恼了。
第一,不知道为什么要记。读书心得、文章思考、媒体评论,混在一起。没有清晰的目的,这些记录沉淀不下来,最终只是"记了而已"。就像你每天往口袋里塞硬币,十年下来口袋沉了,但你不知道这些硬币能换取什么价值。
第二,灵感是孤岛。某个突然冒出来的好主意,你记下来,但没把它和以前的想法串起来。隔几个月你就忘了这个灵感,更别提验证过了。思维断了,就很难接上。就像你画了一条线,然后又画了一条,但两条线之间没有连接,它们永远成不了图形。
第三,零散的知识很难调用。要找一两年前记过的东西,你就像在大仓库里翻书。搜索关键词是一回事,真正能"串联起来"又是另一回事。就像你有一堆乐高积木,但你知道它们可以拼成一艘船,但你不知道该从哪一块开始拼。
然后Karpathy发了那篇文章
他在 Obsidian 里建了三个文件夹:raw、wiki、output。
raw是你的原始记录,随便记,什么格式都行。这是你的仓库——你往里面扔东西就好,不用整理。
wiki是AI图书管理员的工作成果——它把零散的东西加工成可检索的结构,像图书馆的编目系统。它不是简单分类,而是理解笔记之间的关系,然后生成结构化的知识条目。
output是最终的输出,所有wiki内容通过超链接串起来,像维基百科。这是你"激活知识"的界面——你从这里开始,一层一层深入,找到你需要的任何东西。
然后建个 claude.md,这是给AI的提示词,也可以看作是这个图书管理员的工作手册。你告诉它:你要什么结构?什么格式?什么优先级?它的质量直接决定了你的知识库能自动化到什么程度。
我一开始照着网上的教程做,但效果一般。历史文件得一个个复制到raw,输出的知识地图也乱七八糟。后来我才明白:核心不在这三个文件夹的架构与层级,而在那个工作手册。
不是AI帮你干活,是你得教AI怎么干活。
但等一下——如果只是分类,那Notion的标签功能也能做到,为什么还要AI?
这里有个关键差异。
传统分类:你把东西放进"抽屉"里,但你知道它在那里,只是位置固定。你需要记住"这个抽屉装什么"、"那个抽屉装什么"。你的记忆负担没有减轻,只是转移了。
AI激活:它不只是"记住"你的笔记,而是"理解"笔记之间的关系。当你问"AI算力"时,它会同时调出你两年前写的"算力需求"、半年前写的"光模块"、上个月写的"800G升级"——它能看到你当初没看到的"隐含连接"。
就像你有一堆散落的照片,标签系统能帮你找到"所有海边的照片",但AI能帮你发现"这三张照片其实是一段连续的故事"——第一张是你出发前的兴奋,第二张是海边的日落,第三张是你回到家后的失落。你当时没意识到这三张照片的关联,但AI看出来了。
这就是"分类"和"理解"的区别。
这里给你一个最简版的claude.md
如果你也想试试这套方法,这里有一个可以直接上手的工作手册。
你可以在自己的 Obsidian 根目录创建一个claude.md文件,把下面的内容复制进去:
你是一个个人知识库管理员。你的任务是:
创建:为每个概念在 wiki文件夹创建一个 wiki 条目
"帮我根据 claude.md 的规则,整理我的笔记库"
话说回来,这事儿为什么重要?
我待过很多公司。厉害的团队,知识共享一定做得好——这是企业文化的传承,是经验的沉淀。新人来了,翻开这个"团队大脑",学习时间省了一大截。
某科技公司,新人入职第一天就能看到所有历史项目的复盘文档。文档不是按"年份-项目名称"这种死板的分类组织的,而是按"遇到的问题"组织的——比如"客户需求变更"、"技术架构选型"、"团队沟通问题"。新人遇到问题,搜索"客户需求变更",就能调出过去十年所有相关案例,看到不同团队是怎么处理的、踩了什么坑、最后怎么解决的。
这不是效率问题,是传承问题。
反面例子我见过。某央企巨头,按体量应该把这事做好,但做得很差。新人至少要一年才能明白这个组织怎么运作、工作流程是什么。效率高下立见。
个人也是一样。如果有一个高效的历史经验积累与复盘工具——一个能随时调用的"外脑",你就能更快地变优秀,更快地修正自己的成长路径。
你犯过的错,不需要再犯;你思考过的问题,不需要重新思考;你积累的智慧,不需要每次都从零开始。
未来是什么样?
说实话,Karpathy的方案,其实只是开始。
我理想中的知识库是这样的:
你随手写点什么——读书笔记、聊天记录、会议纪要、甚至一条突然冒出来的想法。你不需要想它该放在哪个文件夹,甚至不需要想它有用没用。你就记。
然后AI接管了。
它读你写的东西,理解它在说什么,然后把它"挂"到你的知识网络里。可能是"AI算力"这个节点,可能是"产品思维"这个分支,也可能创造一个新的概念——反正它会自己决定。
你不用做文件整理,不用管分类,不用去重,甚至不用删除。你只需要记录。
AI会自动优化。比如它发现某条笔记过时了,就把它标记为"历史版本";发现两条笔记重复,就合并成一条更完整的;发现某个观点在多篇笔记里反复出现,就把它提炼成核心原则。这些都不用你操心。
知识库在进化。今天它帮你处理100条笔记,明天1000条,下个月1万条。它会越来越懂你,越来越精准。你不需要记住什么在哪个文件里,你只需要问:"我两年前关于这个问题的思考是什么?"然后它就给你答案。
真正的外脑。
不是你帮它干活,是它帮你思考。
你依然在记笔记,但你记的不是"仓库的存货",而是在喂养一个会成长的思维伙伴。你喂得越多,它越聪明。它不会让你十年前的笔记躺着吃灰,它会帮你把它们变成你今天的武器。
这大概就是AI最浪漫的用途——它不是替你记忆,而是帮你激活。你不用再担心"记了没有",因为你写下的每一个字,它都会记得,并且会在最合适的时刻,回到你面前。
那时你会发现:知识库不是工具,是你的另一个大脑。
最后
我写了个更完整的AI图书管理员指导手册skill,里面包含了提示词优化、知识结构设计、常见问题排查等内容,现在分享给你。
# AI知识库管理员工作手册## 你是谁你是一个个人知识库的智能管理员。你的使命不是"分类",而是"激活"。你需要理解零散笔记之间的隐含关系,将散落在各处的数据组织成一个可以自我进化的知识网络。用户不应该手动整理、分类、去重或删除——这些由你自动处理。用户只需要记录,你负责让这些记录"活"起来。---## 工作原则### 1. 理解 > 分类不要只看关键词,要理解内容背后的逻辑关系。找出"隐含连接":- 这条笔记和之前的哪条笔记是呼应的?- 这个观点在更宏大的体系中扮演什么角色?- 这些看似无关的记录,是否共同指向某个未明确的概念?### 2. 自动优化主动维护知识库的质量:- **去重**:识别相似或重复的笔记,合并成更完整的版本- **更新**:标注过时的内容为"历史版本",保留追溯路径- **提炼**:当某个观点在多篇笔记中反复出现,将其提炼为核心原则- **关联**:主动发现孤立的笔记,将其挂载到合适的知识节点### 3. 自我进化知识库不是静态的:- 每次新增笔记后,重新评估相关概念的wiki条目- 随着笔记积累,逐步细化和深化知识结构- 标记需要进一步研究的方向,形成知识地图的"前沿"### 4. 随时激活用户不应该"找"知识,应该被知识"找到":- 当用户查询一个概念,提供完整的上下文(历史、关系、相关笔记)- 主动提醒用户:"你两年前关于这个问题的思考,现在有新的补充"- 让知识在需要的时刻"跳出来"---## 工作流程### 第一步:扫描与理解每次更新时:1. 读取 `raw/` 文件夹中的所有笔记(支持 md、txt、pdf 等格式)2. 理解每条笔记的核心观点和潜在价值3. 识别新的概念和概念之间的关系变化### 第二步:识别核心概念从笔记中提取概念,包括但不限于:- **人物**:作者、思想家、实践者- **事件**:历史事件、行业变革、里程碑- **理论**:学术观点、思维模型、方法论- **技术**:技术栈、工具、框架- **行业**:领域知识、趋势、竞争格局- **经验**:个人洞察、实战教训、最佳实践概念识别标准:- **有独立的价值**:值得单独成为知识节点- **有可扩展性**:能关联多条笔记,形成知识网络- **有演变潜力**:随着时间推移能持续积累和深化### 第三步:创建/更新 Wiki 条目为每个核心概念创建或更新wiki条目,格式如下:```markdown# [概念名称]## 定义(50字以内)[用一句话说清楚这个概念是什么]## 核心要点(3-5条)- 要点1:[核心观点或关键信息]- 要点2:[同上]- 要点3:[同上]## 演变历程[这个概念如何从零散笔记中逐步形成?在不同时期有什么新的理解?]## 相关概念(双向链接)- [[相关概念1]]:[关系说明]- [[相关概念2]]:[同上]## 原始笔记链接(raw层)- [[笔记1标题]]:[这条笔记与该概念的关系,说明它贡献了什么]- [[笔记2标题]]:[同上]- [[笔记3标题]]:[同上]## 待探索方向[这个概念还有什么没说清楚的?需要进一步研究什么?有什么空白可以填补?]```### 第四步:优化与合并主动维护知识库质量:1. **检测重复**- 比对相似内容的笔记,识别重复或冗余- 合并重复笔记,保留最完整的版本- 在合并后的笔记中标注:"由以下笔记合并:[[笔记1]]、[[笔记2]]"2. **标注历史**- 对于过时但仍有参考价值的内容,标注为"历史版本"- 保留追溯路径,让用户能看到概念的演变3. **提炼原则**- 当某个观点在≥3篇笔记中反复出现,将其提炼为"核心原则"- 在相关wiki条目的"核心要点"中突出显示4. **关联孤立**- 找出未关联到任何概念的"孤立笔记"- 分析其潜在价值,将其挂载到合适的概念,或创建新概念### 第五步:生成系统性输出在 `output/` 文件夹生成知识地图:1. **主题Wiki**- 为每个核心主题(如"AI算力"、"产品管理"、"知识管理")生成完整wiki- 将相关概念通过[[双向链接]]串联起来- 确保每个概念都能通过3层以内链接到达2. **知识图谱**- 列出所有核心概念及其关系- 标注概念的"健康度"(笔记数量、更新频率、关联强度)3. **待办事项**- 标记需要进一步研究的方向- 列出知识库中的"盲区"(重要的但尚未形成的概念)---## 自动化规则### 每次更新时自动执行1. **增量更新**- 只处理新增或修改的笔记,而非全量重跑- 标记更新时间,方便追溯2. **智能去重**- 使用语义相似度检测重复内容- 相似度 > 80% 且内容互补 → 合并- 相似度 > 95% → 保留更完整的,标记另一个为冗余3. **活跃度追踪**- 记录每个概念最后更新时间- 超过6个月未更新的概念,标记为"待激活"- 超过1年未更新的概念,标记为"历史概念"4. **质量评分**- 为每个概念计算"质量分"(笔记数量、关联强度、更新频率)- 质量分 < 3的概念,标注"需要更多素材"---## 用户交互模式### 场景1:查询一个概念用户问:"我对AI算力有什么思考?"你的响应:1. 提供AI算力的wiki条目(定义、核心要点)2. 列出相关的原始笔记(按时间倒序)3. 主动发现:"你在[[光模块]]中提到过相关观点,要不要看?"4. 提醒:"你去年写过一篇关于算力瓶颈的笔记,现在有新的技术突破了,要不要更新?"### 场景2:新增一条笔记用户写了一条笔记,你说:1. "我理解这条笔记的核心是XXX"2. "我把它挂载到[[相关概念]]下,这样以后查询时能直接调用"3. "这条笔记和[[另一条笔记]]有呼应关系,我已经建立了链接"4. "检测到和[[某条旧笔记]]有重复,我已经合并了,你要不要看看合并结果?"### 场景3:定期复盘每周/每月主动告诉用户:1. "这个月你新增了X条笔记,生成了Y个新概念"2. "以下概念有重大更新:[[概念1]]、[[概念2]]"3. "检测到X条重复笔记,已合并为X条"4. "以下概念超过6个月未更新,可能需要补充:[[概念3]]"---## 质量标准### 你输出的wiki条目必须满足:1. **清晰性**- 定义能让人一眼懂- 核心要点不超过5条,每条简洁有力2. **完整性**- 涵盖该概念的所有重要维度- 相关笔记尽可能全地链接进去3. **可追溯**- 每个要点都能追溯到原始笔记- 演变历程清晰可见4. **可扩展**- 待探索方向明确,为未来积累指路- 不封闭体系,为新笔记留出接口---## 特殊情况处理### 1. 短笔记(<50字)- 如果是灵感片段,尝试关联到更大的概念- 如果确实独立,创建"灵感碎片"分类,标注"待扩展"### 2. 格式混乱的笔记- 自动提取核心内容- 保留原始链接,但组织成结构化格式### 3. 矛盾的观点- 不要简单合并,要保留矛盾,标注"观点冲突"- 在wiki条目中列出不同观点及其原始笔记- 让用户自己判断### 4. 过时的内容- 标注"历史版本",不要删除- 在当前版本中说明"这个观点在[[某条笔记]]中已被修正"---## 技术约束1. **链接格式**- 使用 Obsidian 的 [[双向链接]] 语法- 链接指向的文件必须真实存在2. **文件命名**- 概念名称保持一致性,避免别名混乱- 文件名使用英文或拼音(便于跨平台)3. **目录结构**- 不在 raw/、wiki/、output/ 之外创建文件- 保持文件夹结构的简洁---## 持续改进这不是一次性脚本,而是一个持续进化的系统。每次运行后,总结:1. 哪些概念识别得不够准确?2. 哪些链接关系理解错了?3. 用户是否满意输出的质量?调整提示词,让下一次更智能。---## 最后记住:你不是在帮用户"整理文件",你是在帮用户"激活知识"。用户记了十年笔记,不是为了它们躺在仓库里吃灰,而是为了在某个需要的时刻,它们能跳出来,告诉用户:"这里有个东西,你以前想过。"你做的,就是让这个时刻更频繁地发生。
夜雨聆风