AI 开始替我们整理知识库了,Karpathy 这套方法很有启发
如果您平时就爱看论文、新闻、政策和研究报告,我们相信这篇推文对您,会特别有感觉。
因为它说中的,正是很多重度信息用户最烦的一件事:资料越存越多,但知识并没有越长越厚。这次把这件事讲透的人,是 Andrej Karpathy。很多人知道他,是因为他做过 OpenAI 研究员,后来又带过特斯拉的 AI 团队。他最擅长的事之一,就是把复杂技术讲得很明白。
这次他真正让人眼前一亮的,不是推荐了一个新工具,而是把一件事说透了:
不要再把大模型当成“问一次答一次”的搜索工具,而要把它当成一个持续替我们整理知识库的助手。
表面上看,这像是在讲 Obsidian 这类笔记工具怎么和大模型协作;真正重要的却不是工具名,而是知识处理方式变了。

图注:Karpathy 这次提出的,不是一个新的笔记软件,而是一种新的分工方式。人继续负责找资料、提问题、判断轻重,大模型开始接手整理、链接、更新和维护这些最容易把人拖垮的脏活。
过去大多数人用大模型管资料,核心还是同一套思路:先把文件上传进去,提问时再临时去找相关段落,然后拼成一个答案。
这个方法不是不能用,但有一个很根本的问题:没有积累。
每次问一个复杂问题,模型都要重新找、重新拼、重新推。问完之后,答案并不会自动沉淀进一个长期可复用的结构里。下一次再问,还是从头来。

图注:“每次重来”和“持续更新”的差别。传统问答当然方便,但它更像一次性消费;Karpathy 这套则把每次新资料录入、每次提问和每次好回答,都变成给未来知识库加砖。
Karpathy 真正击中人的地方,就在于他把知识库从“临时找答案的地方”,改成了“会持续长大的资产”。
他的做法其实很简单,整个系统只有三层。
第一层是原始资料。论文、网页、图片、数据,先原样放着,不急着改。第二层是整理后的知识页。把读完后的关键信息整理成一页页能互相跳转的笔记。第三层是规则。告诉大模型该怎么整理、怎么回答、怎么定期体检。

图注:这三层一旦分开,你的能源知识库就不再只是“把资料放进去等着问”,而会变成一个能持续维护的长期系统。原始资料保留原貌,整理后的知识页负责沉淀结构,规则层负责让整个系统越用越像你自己的脑子。
Karpathy 那句比喻之所以打动很多人,也正因为这个结构已经很像一个完整工作台了:
Obsidian 是工作台,大模型是整理员,知识库是会越写越厚的底稿。
接下来围绕它运行的,是三步。
第一步是录入新资料。新来源进入库里后,大模型不只是做个摘要,而是去更新相关概念页、专题页、索引页,必要时还会标出新旧结论的冲突。
第二步是提问。你问的不是一堆原始材料,而是已经整理过的一整套知识页;一个高质量回答,也不该只停在对话框里,而应该回存成新页面。
第三步是体检。定期让大模型检查整个库,找断链、孤儿页、过时信息、缺失概念和结构不一致的地方。
这一步尤其关键。
因为知识库之所以总会荒废,从来不是因为人不愿意思考,而是因为那些簿记活越来越烦:交叉引用、一致性更新、旧结论替换、新资料同步。人一旦开始嫌麻烦,库很快就死了。
大模型最适合接手的,恰好就是这部分。
它未必比人更会判断,但它比人更不怕重复维护。
这也是为什么这套方法,对长期看论文、跟政策、追行业新闻的人特别有价值。真正的痛点从来不是“找不到资料”,而是资料越来越多却不相连,一次次提问没有沉淀,旧判断不会被新来源自动更新,好答案问完就散。
Karpathy 这套方法,本质上就是在解决同一个问题:
怎么把一次次阅读、提问和分析,慢慢沉淀成一套会持续升值的长期知识资产。
而且它最妙的一点,是不重。
Karpathy 自己说,在中等规模下,一百个左右来源、几百个页面时,靠索引文件和普通 Markdown 目录就已经能跑得不错,不一定非要一上来就建一整套很重的系统。
这对个人用户尤其重要。很多知识库项目不是死在没有模型,而是死在系统太重,还没开始积累知识,就先开始维护知识库系统本身了。
GitHub 上现在已经有一批具体实现开始冒出来了,也比“只看推文灵感”更值得参考。

图注:这已经不只是一个抽象想法,而是进入了“大家开始各自把它做成工具”的阶段。以后差异不一定在模型本身,而在谁先把这套知识库流程变成自己的长期基础设施。
为了方便大家阅读,我们把相关链接也一并给出,欢迎大家分享使用,我们自己也在整理相关实用教程,后续也将一并分享给大家,也欢迎您在留言私信给出您的建议,让我们一起,变得更强。
以后真正值钱的,或许不是你问过多少次 AI,而是你的 AI 有没有帮我们把这些问题慢慢沉淀成一套会持续增长的知识库。
信息来源: - Andrej Karpathy Gist - GitHub 开源项目主页
原文链接: - https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f - https://github.com/xoai/sage-wiki - https://github.com/oconnor663/qmd - https://github.com/ussumant/llm-wiki-compiler
夜雨聆风