打开你的微信收藏夹。
不出意外,里面应该堆着几百甚至几千条「稍后再读」。
有公众号长文,有同事甩过来的链接,有自己看到一半划走的资料。
你心里很清楚:这里面有 80% 这辈子再也不会打开。
打开你的 Notion、Obsidian、印象笔记,情况也差不多。
文件夹一层套一层,命名乱七八糟,有的甚至叫「新建文档 1」「未命名 3」。
你不缺资料。
你缺的是把这些资料变成「知识库」的能力。
而做知识库之前,绕不开的第一步,就是分类。
一、为什么资料分类是知识库的拦路虎?
很多人理解的知识库,是「把东西存到一个地方」。
这个理解是错的。
真正的知识库,至少要满足三个条件:
你想用的时候能找到。 你找到的时候能看懂。 你看懂之后能调用到当下的工作里。
按这三个标准看,绝大多数人的收藏夹,连第一条都做不到。
存进去的资料,本质上是被「埋」起来,不是被「存」起来。
要让资料能被找到,前提是它有结构。
结构最朴素的形式,就是分类和标签。
没有分类的资料,等于没收藏。
但分类这件事的难处在于:
资料是动态生长的,你今天的兴趣点和半年前完全不一样。
手工分类一开始还能维护,时间一长就崩。
这正是 AI 能介入的地方。
二、很多人现在是怎么管理资料的?
我观察过身边不少程序员、运营、内容创作者,大致有这么几种"伪知识库"。
第一种,按平台分散。
微信收藏夹一份,浏览器书签一份,掘金收藏一份,公众号关注一份。
资料在哪里都有,但每个平台都不全,要找的时候不知道去哪个角落翻。
第二种,按时间堆叠。
笔记软件按日期建文件夹,2024 年 11 月一个,2024 年 12 月一个。
时间是最没有信息量的维度,半年后你根本想不起来某篇文章是哪个月看的。
第三种,按一时心情建文件夹。
「重要资料」「待看」「精华」「以后用」。
每个文件夹都像垃圾桶,进去就出不来。
第四种,全靠搜索。
「反正我直接搜就行」,但搜索的前提是你记得关键词。
而真正有价值的资料,往往是你"不知道自己需要"的时候才需要。
第五种,干脆躺平。
「整理资料浪费时间,我就让它乱着」。
直到有一天写方案、写文章、做分享的时候,才发现自己什么都没沉淀下来。
这几种方式的共同问题,是把"收藏"当成了终点,而不是起点。
资料一旦进了收藏夹,就再也不会进入二次加工的流程。
AI 在这里能帮的,不是替你看文章,而是帮你把已经收藏的资料做一遍"分类、提炼、关联"的预处理。
让你下次想用的时候,能在 10 秒内找到它。
三、AI 在资料分类上能帮你做哪四件事?
我建议把 AI 的角色定位成「资料管家」,而不是「替你阅读的助手」。
它能帮你完成四件事。
第一件,打标签。
每篇资料读完,自动产出 3 到 5 个标签,覆盖主题、领域、阶段、用途。
第二件,提炼摘要。
每篇资料压成一段 150 字以内的核心要点,让你日后扫一眼就知道讲了什么。
第三件,建立主题索引。
把同一主题下的资料聚类,生成索引页,让你看到自己在某个方向上已经积累了哪些素材。
第四件,生成复习清单。
按主题、按时间、按重要度,定期吐出一份"该回顾一下了"的清单,让资料从沉睡状态被重新激活。
这四件事的共同点,是 AI 不替你思考。
它只是帮你把已经收藏的资料,从一堆「平铺」的链接,变成一张「有结构」的网。
至于这张网里哪个节点最重要,哪个方向值得深挖,那是你自己的事。
四、具体怎么做?四步从混乱资料到可调用知识库
我建议你用下面这套四步法。
不要一上来就追求完美,每一步都先用最小成本跑通。
第一步:先定义你自己的标签体系
很多人一上来就让 AI 「自由打标签」,结果出来的标签五花八门。
一会儿是「AI」,一会儿是「人工智能」,一会儿是「LLM」,一会儿是「大模型」。
同一个东西被打成三个标签,比不打更糟。
正确的顺序,是先定义一份自己的标签清单。
这份清单不需要复杂,建议分三类:
主题标签:你关注的核心方向,比如「AI 编程」「外贸建站」「自动化办公」。 类型标签:资料的形态,比如「教程」「案例」「工具」「观点」「踩坑」。 阶段标签:你打算怎么用它,比如「待读」「精读」「素材」「归档」。
可以先用一份纯文本模板写下来:
[主题标签]- AI 编程- AI Agent- 自动化办公- 外贸建站- AI 商业化[类型标签]- 教程- 案例- 工具- 观点- 踩坑[阶段标签]- 待读- 精读- 素材- 归档
这份清单不是一次性写死。
每个月可以拿出来看一眼,删掉不再关注的,加上新冒出来的。
但同一时间,标签数量建议控制在 20 个以内。
太多就等于没有。
第二步:让 AI 批量打标签和提炼摘要
标签体系定好之后,下一步就是让 AI 按这套规则,给已有资料打标签 + 写摘要。
提示词可以这样写:
你是一名擅长信息整理的资料管家。我会给你一篇文章的标题和正文,请你完成两件事:1. 从下面给定的标签清单中,挑出 3 到 5 个最匹配的标签。- 如果文章内容不属于任何已有标签,请直接说"暂不匹配",不要自己造新标签。2. 用 150 字以内,写一段中文摘要,要求包含:- 文章主要讲了什么问题- 给出了什么核心方案或观点- 适合什么场景或人群参考请用以下 JSON 格式输出,不要多余说明:{"title": "原文标题","tags": ["标签1", "标签2"],"summary": "摘要内容"}可选标签清单:[主题标签] AI 编程, AI Agent, 自动化办公, 外贸建站, AI 商业化[类型标签] 教程, 案例, 工具, 观点, 踩坑[阶段标签] 待读, 精读, 素材, 归档文章标题:(此处粘贴标题)文章正文:(此处粘贴正文)
跑一次之后,输出大致是这样:
{"title": "用 Claude Code 重构一个老 Spring Boot 项目的全过程","tags": ["AI 编程", "案例", "精读"],"summary": "文章以一个 5 年龄的 Spring Boot 项目为例,讲了如何用 Claude Code 分模块阅读、提炼调用关系、生成重构方案,再小步替换的全过程。重点提醒不要让 AI 一次性大改,而要按模块逐步评审。适合接手老项目、需要做技术改造的后端程序员参考。"}
这一步的产出,就是每篇资料的「身份证」。
有了标签和摘要之后,你后面找资料、回顾资料、二次创作的成本,会下降一大截。
如果你的资料是批量的,可以用脚本把这套提示词跑成一个简单流程:
1. 读取一个资料列表(标题 + 正文 + 原文链接)2. 逐条调用大模型,按上面提示词输出 JSON3. 把 JSON 追加写入一个统一的 knowledge.json 文件
不需要复杂的工程,就够你用半年了。
第三步:让 AI 建立主题索引
打了标签只是把资料贴上了便签,还不算"知识库"。
下一步,是让相关资料"聚起来"。
提示词可以这样写:
你是一名信息架构助手。我会给你一份 JSON 资料清单,每一条包含 title、tags、summary 三个字段。请你完成以下任务:1. 按主题标签把资料聚类。2. 在每个主题下,挑出 1 到 3 篇最具代表性的资料,作为「核心入门资料」。3. 在每个主题下,列出 1 到 2 个值得追问的子方向,例如可以继续深入研究的小问题。请用 Markdown 格式输出,不要使用 JSON。输出结构:## 主题名**核心入门资料:**- 标题 1 —— 摘要简述- 标题 2 —— 摘要简述**可继续深入的方向:**- 子方向 1- 子方向 2资料清单:(此处粘贴 knowledge.json 内容)
跑出来的效果大致是这样:
## AI 编程**核心入门资料:**- 用 Claude Code 重构一个老 Spring Boot 项目的全过程—— 案例完整,适合作为重构方法论的入门读物。- AI 生成代码不稳定?给程序员的提示词分层方法—— 把提示词拆成五层,是工程化使用 AI 的基础。**可继续深入的方向:**- 如何评估 AI 重构方案的风险- 团队层面的 AI 编程协作规范## 自动化办公**核心入门资料:**- 用 AI 自动生成日报,不是复制流水账,而是提炼工作价值—— 把"日报"这件日常事拆成可执行流程。**可继续深入的方向:**- 周复盘和月度成果清单的 AI 工作流- 跨工具(飞书 / 钉钉 / Notion)的日报自动同步方案
到这一步,你的资料就不再是平铺的链接列表。
它变成了一份「主题索引」:你可以一眼看出自己在哪个方向上积累得厚,在哪个方向上还基本是空白。
这件事,比"我收藏了多少篇文章"重要 10 倍。
第四步:让 AI 生成复习清单
资料整理完,最后一步不能少。
如果你不定期回头看,再好的知识库也会"再次睡死"。
我建议每周或每两周做一次「资料复盘」。
提示词可以这样写:
你是一名学习陪练助手。我会给你一份资料清单(title + tags + summary + 收藏日期),请你帮我生成一份本周复习清单。要求:1. 优先挑选最近 2 周内收藏、但还没有"精读"标签的资料。2. 在每个主题下最多挑 3 篇,避免一次复习负担太重。3. 对每一篇,提出 1 个"小练习",例如:- 用自己的话复述这篇文章的核心观点- 找出一个工作中可以套用的场景- 设计一个最小验证实验请用 Markdown 输出,结构如下:## 主题名### 文章标题- 摘要回顾:- 小练习:资料清单:(此处粘贴最近 2 周新增的 knowledge.json)
跑出来的复习清单,大致会是这样:
## AI 编程### 用 Claude Code 重构一个老 Spring Boot 项目的全过程- 摘要回顾:文章讲了分模块阅读、提炼调用关系、生成重构方案、小步替换的全流程。- 小练习:选自己手上最熟的一个老项目,用同样的步骤跑一遍前两步(阅读 + 调用关系),看看能不能写出一份调用链草图。## 自动化办公### 用 AI 自动生成日报,不是复制流水账,而是提炼工作价值- 摘要回顾:拆成原始记录、结构化、价值筛选、按读者分版本四步。- 小练习:今晚下班前用这套四步法写一份今天的日报,对比你上周的日报,看看哪些表达变得更清晰。
每次复盘只看 5 到 8 篇资料,控制在 15 分钟左右。
不是为了"读完所有收藏",而是让最近收藏的资料真正进入大脑,而不是停留在 URL 列表里。
五、案例演示:一周资料从混乱到结构化
把上面四步串起来,一个程序员的一周资料整理节奏,大致是这样的。
假设这一周,你随手收藏了 6 篇资料:
1. 用 Claude Code 重构一个老 Spring Boot 项目的全过程2. 如何写出让 AI 不胡说八道的提示词3. 程序员副业指南:从接单到产品化4. 一份用 AI 整理客户跟进的工作流5. ChatGPT 写英文产品页的 7 个坑6. 用 Notion 搭建个人选题库
第一轮,按第一步定的标签清单跑一遍 AI 打标签 + 摘要。
得到的产出大致是这样:
[{"title": "用 Claude Code 重构一个老 Spring Boot 项目的全过程","tags": ["AI 编程", "案例", "精读"],"summary": "用 Claude Code 拆解、阅读、重构老项目,强调小步替换。"},{"title": "如何写出让 AI 不胡说八道的提示词","tags": ["AI 编程", "教程", "待读"],"summary": "讲了提示词中的角色、约束、验收标准三要素,防止幻觉。"},{"title": "程序员副业指南:从接单到产品化","tags": ["AI 商业化", "观点", "待读"],"summary": "从接单、复用、产品化三个阶段讲程序员副业路径。"},{"title": "一份用 AI 整理客户跟进的工作流","tags": ["自动化办公", "案例", "素材"],"summary": "把客户沟通记录用 AI 转成跟进表+下一步动作。"},{"title": "ChatGPT 写英文产品页的 7 个坑","tags": ["外贸建站", "踩坑", "素材"],"summary": "总结了直接翻译、卖点错位、行业不匹配等 7 个常见问题。"},{"title": "用 Notion 搭建个人选题库","tags": ["自动化办公", "教程", "归档"],"summary": "讲了 Notion 选题库的字段设计和与公众号写作流程的衔接。"}]
第二轮,按第三步跑一次主题索引。
得到的索引大致是这样:
## AI 编程- 核心入门:用 Claude Code 重构一个老 Spring Boot 项目(精读)- 待读:如何写出让 AI 不胡说八道的提示词- 子方向:AI 编程在老项目改造中的使用边界## AI 商业化- 待读:程序员副业指南:从接单到产品化- 子方向:程序员的小服务如何报价## 自动化办公- 素材:一份用 AI 整理客户跟进的工作流- 归档:用 Notion 搭建个人选题库- 子方向:客户跟进表的字段设计## 外贸建站- 素材:ChatGPT 写英文产品页的 7 个坑- 子方向:英文产品页的本地化改写流程
第三轮,跑一次复习清单。
得到的复习清单大致是这样:
## AI 编程### 如何写出让 AI 不胡说八道的提示词- 摘要回顾:提示词三要素(角色、约束、验收)。- 小练习:挑一段你最近常用的提示词,加上"角色 + 验收标准"两行,看看输出有没有变化。## AI 商业化### 程序员副业指南:从接单到产品化- 摘要回顾:副业的三段路径——接单、复用、产品化。- 小练习:列出你过去一年帮别人解决过的 3 个具体问题,哪一个最容易被复用?## 自动化办公### 一份用 AI 整理客户跟进的工作流- 摘要回顾:用 AI 把沟通记录转成跟进表 + 下一步动作。- 小练习:用本周一次跟同事或客户的实际对话,跑一遍这个工作流。
一周下来,你做的不是"看完 6 篇文章",而是:
给每篇资料贴好了身份证(标签 + 摘要)。 把它们放进了主题索引,看到了自己在哪个方向上的积累。 抽出了 3 篇做小练习,让资料真的进入大脑。
整个流程,AI 干的事其实很简单。
它没有替你阅读,也没有替你思考。
它只是帮你把"读 — 收 — 用"这条断掉的链路重新接起来。
六、避坑提醒:做个人知识库最容易踩的 5 个坑
坑一:标签体系一上来就贪大
很多人一上来就列了 50 个标签,想覆盖所有可能。
结果两周后,自己都记不住有哪些标签,每次都要翻清单。
更糟的是,AI 在这么多标签里挑选时,准确度会迅速下降。
我建议初版标签控制在 15 到 20 个以内。
宁可后面慢慢加,不要一次性把表打满。
坑二:让 AI 替你「读完」每一篇文章
AI 给的摘要再好,也只是摘要。
如果你把摘要当成"我已经看过这篇了",那知识库会变成你逃避阅读的工具。
摘要的作用,是帮你判断「这篇值不值得精读」「以后用得上时怎么找回来」。
真正的精读和思考,还是要你自己做。
我建议在标签里专门保留一个「精读」标签,明确告诉自己:
只有打了精读标签的文章,才算真正进入过我的大脑。
坑三:不给人工修正留口子
AI 打的标签和摘要,准确率大概在 80% 到 90%。
剩下 10% 到 20% 的偏差,必须由你自己修正。
如果你不留这个修正的口子,错的标签和摘要会越积越多,半年后整个知识库的可信度会塌方。
我建议每周做主题索引和复习清单时,顺手扫一眼有没有明显错的标签。
发现一个改一个,比攒到最后大扫除省事得多。
坑四:摘要长度失控,反而成了新负担
有些人会让 AI 给每篇文章写一份 500 字以上的"详细摘要"。
听起来很丰富,但用的时候你根本读不下去。
摘要的标准是「让你 10 秒内判断要不要回头读原文」。
长度建议控制在 150 字以内,最多不超过 200 字。
短才有用,长就是垃圾。
坑五:收藏完就忘,根本不走复习流程
整理资料最大的浪费,是只整理不回看。
打了标签、写了摘要,但每周不抽时间复盘,资料还是在沉睡。
我建议把"每周复盘资料"做成一个固定动作,比如:
每周日晚上花 15 分钟,跑一次第四步的复习清单提示词。 把这一周新打了"精读"标签的资料,专门写一段 200 字的"我学到了什么"。 每个月最后一天,让 AI 基于"精读"标签的摘要,生成一份月度成长清单。
这套机制跑起来之后,你会发现:
知识库的价值,不在于你存了多少,而在于你定期带它出门遛了多少次。
七、总结
打造个人知识库,关键不是"找一个酷炫的工具",也不是"把收藏夹搬到 Notion"。
关键是把这件事拆成四步:
先定义自己的标签体系,控制在 20 个以内,宁少勿多。 让 AI 按标签清单批量打标签 + 写 150 字以内摘要,给每条资料一张身份证。 让 AI 把资料按主题聚类,生成主题索引,让你看到自己的积累分布。 让 AI 每周或每两周生成一次复习清单,让资料真正进入大脑。
只要这四步认真走完,你的资料就会从「收藏夹里的死链接」,变成「可调用的知识网络」。
收藏不是目的,调用才是。
AI 提供的,是让"调用"这件事变得轻松的工具。
至于网里到底沉淀了什么,那是你自己的事。
结尾互动
你现在的资料管理状态,更接近哪一种?
是堆在收藏夹里的几千条链接、按时间堆叠的笔记文件夹、还是已经在用某个工具做主题索引?
欢迎在评论区聊聊你最头疼的资料管理问题,以及你试过的哪些方法没成功。
如果你想要一份可直接复用的提示词和模板,可以关注公众号「明哥AI实战笔记」,回复关键词:
知识库模板
我会整理一份「标签体系示例 + 打标签提示词 + 主题索引提示词 + 周复习清单 SOP」,方便你下周就开始整理自己的资料。
夜雨聆风