起因:资料越多,越找不到想要的东西
我长期关注一位投资博主(以下简称"博主")的周度直播分析。每周他会产出两份材料:一份是结构化的投资总结(各板块判断、操作建议、逻辑分析),另一份是口述全文的文字版,包含大量情绪表达、数据补充和即兴发挥。
从去年底到今年四月,我攒了十四期周总结。覆盖的板块包括锂电、光通信、创新药、有色、半导体、日经、机器人等等——每个板块都有独立逻辑,板块之间还有千丝万缕的关联。
问题很快浮现:我想查"黄金这个板块从去年到现在观点怎么变的",得翻十几份文件;想知道"三月中旬那周整体判断是什么",得回忆那期是哪个文件。观点散落各处,缺乏连续性和可追溯性。
于是我决定用 AI(具体是 Claude Code)基于上期提到的LLM wiki知识库搭建方式用 Claude Code 搭建个人LLM Wiki 知识库——从方法论到实战的完整记录,搭一个结构化的投资知识库。这不是简单的文档整理,而是让 AI 充当"知识编辑",把口语化、碎片化的投资观点编译成可查询、可追溯、可复盘的知识体系。
本文记录了从架构设计到全量编译完成的完整过程,以及其中踩过的坑和调整。
第一步:定义架构——不是所有知识都该放在一起
投资分析内容的独特之处在于:你既需要按板块纵深追踪某个标的的观点演变,又需要按时间还原每周的市场全貌。传统知识库要么像百科全书(按主题),要么像日记(按时间),都不够。
我的方案是混合结构:
- topics/(主题页):按投资标的/赛道组织。每个板块一个页面,从首次提及到最新判断,按周记录完整的观点演变时间线。
- weeks/(周编译页):按周组织。每周一个页面,还原当周所有板块的判断和市场氛围。
- methods/(方法论页):提取反复出现的决策框架,比如"业绩线框架""分批止盈法"。
- concepts/(概念页):解释被多处引用的术语和现象,比如"制造业周期""认知扩散"。
这四层目录有明确的边界:有"判断→操作→时间线"的进 topics,有"适用条件+操作步骤"的进 methods,只是个需要解释的词,进 concepts。总之,如果边界不清啥都往一个目录塞,最终会变成垃圾堆。
此外还有 indexes/ 目录放索引,维护一个总索引、一个板块索引和一个时间线索引,方便快速定位。
原始资料放在 raw/ 目录,只读不写。任何格式的新资料——周总结文件夹、周中加餐、随手笔记——直接丢进去就行。
最终目录结构如下:
周总结/├── CLAUDE.md ← 编译规则(自动加载,Claude据此工作)├── raw/ ← 原始资料(只读,不修改)│ ├── 2026-01-30_周总结-260130/ ← 周总结(文件夹)│ │ ├── 总结.md│ │ └── 逐字稿.md│ ├── 2026-04-15_锂电加餐.md ← 周中加餐(单文件)│ └── ... ← 任何格式的投资相关资料└── wiki/ ← AI维护的知识笔记├── topics/ ← 主题页:投资标的/赛道的观点演变追踪│ ├── 有色-黄金铜铝.md│ ├── 出海算力.md│ └── ...├── weeks/ ← 周编译页:每周市场全貌│ ├── 2025-W52.md│ ├── 2026-W05.md│ └── ...├── methods/ ← 方法论页:可执行的决策框架│ ├── 业绩线框架.md│ └── ...├── concepts/ ← 概念页:术语/现象的解释│ ├── 制造业周期.md│ └── ...└── indexes/ ← 索引与导航├── index.md ← 总索引├── topic-index.md ← 主题索引├── timeline.md ← 时间线索引└── log.md ← 操作日志
第二步:写编译规则——让AI按规矩办事
架构搭好了,接下来最关键的一步是写 CLAUDE.md——这是 Claude Code 的项目配置文件,AI 每次工作前自动读取,相当于给它一本"编辑手册"。
这份手册定义了:
资料识别规则:文件夹(周总结)读两个文件交叉印证,单文件(加餐/笔记)直接编译。浓缩标准:提取核心观点、新增信息、操作指令、风险提示、方法论金句。逐字稿中要标注说话人的信心程度("明确建议" vs "可以关注" vs "提一下")。写入规则:编译结果分别写入周编译页、主题页、方法论页、概念页、索引。页面模板:每种页面都有固定格式,确保一致性。
一个重要的设计决策:忠实记录原则。这是投资类内容,AI 的角色是知识管理助手,不是投资分析师。编译页中的"风险提示"字段,只记录博主本人的原话,不加 AI 自己的判断。
最初我设计了五步编译法:识别→浓缩→质疑→对标→写入。但实践后砍掉了"质疑"和"对标"两步,因为 AI 输出的"质疑",全是博主自己已经讲过的风险分析换个标签,AI 没有实盘经验,强行做"对标"反而可能产生误导。
最终简化为三步:识别→浓缩→写入。
第三步:实战编译——从5期到14期
第一阶段:核心框架验证
先编译了最早的两期(2025 Week52 和 2026 Week03),验证架构和模板是否跑得通。这一步创建了 9 个主题页、2 个方法论页和 5 个概念页,基本框架成型。
接着编译 W04 到 W07,覆盖更多板块(存储芯片、智能驾驶、日经),同时验证"追加更新"机制——当主题页已存在时,新观点追加到时间线,更新最新判断。这个机制是整个知识库的核心:让每个板块的观点演变一目了然。

(注:图片仅作为知识库效果举例,不作为投资建议)
第二阶段:全量编译
框架跑通后,开始批量编译剩余的 W09 到 W16。每次编译的流程是一样的:
- 读取 raw/ 中的总结.md 和逐字稿.md
- 提取各板块观点,标注新信息/延续/修正
- 写入周编译页,更新所有相关主题页
- 如有新方法论或新概念,创建对应页面
- 更新索引
这个过程很快——每期编译大约需要几分钟,AI 自动完成所有步骤。我只需要在编译完成后快速检查一下关键判断是否准确记录。
到 W16 编译完成时,知识库包含:
- 20个主题页:覆盖锂电、光通信、有色、创新药、半导体、日经、机器人、电网设备等所有核心板块
- 6个方法论页:业绩线框架、分批止盈法、看长做短、主动买套、A股信息传导生态链、A股板块三段驱动理论
- 14个概念页:从"A浪B浪C浪"到"创业板美股化"再到"A股映射2.0"
- 13个周编译页:每期包含板块观点、逐字稿补充和方法论金句
最终效果如下(依然建议通过Obsidian打开):

实战案例:一个知识库查询能回答什么
全部编译完成后,我试了一个查询:"固态电池板块从去年到现在有什么变化?最新观点是什么?需要加大布局吗?"
AI 直接从知识库中调取了固态电池主题页,给出了带完整引用的回答:
观点演变轨迹:
- 2025年12月:刚出现,定位为"偏题材",技术难点未攻破,大规模放量至少2027年
- 2026年1月:重大转折——产业催化密集落地(车企装车+碳酸锂价格突破+政策加码),从偏题材正式转为"半题材半业绩"
- 2-3月:波段操作,逢跌分批买、碰前高减仓,经历了三波波段行情
- 4月:宁王一季报验证景气度,全产业链被资金认可,"让利润飞"
当前操作建议:未提示减仓止盈。如果后续出现3-5个点的大幅调整,零仓位或新会员可关注电池ETF、锂电材料、锂矿。
这种回答质量,如果不靠知识库,需要我自己翻阅12份周总结中所有提及固态电池的段落,然后人工串联。现在一条查询搞定。
(注:以上仅为知识库效果举例,并非投资建议)
架构演进中的几个关键决策
删除冗余比保留冗余重要
初期设计中有 summaries/ 目录,后来发现 weeks/ 完全替代了它。果断删除,不犹豫。架构设计时难免有冗余,关键是快速发现并清理。
明确边界比模糊包容重要
concepts/ 目录初期是空的,因为不知道放什么。后来定了一个简单标准:"只是个词,需要解释"——制造业周期不是投资赛道也不是操作方法,但被多个页面引用需要解释,这就该放概念页。
AI当编辑比AI当分析师靠谱
裁掉"质疑"和"对标"步骤是最重要的决策。投资类内容,忠实记录博主的原始观点,远比让AI充当他可能不靠谱的"第二分析师"有价值。
日期显示人性化
所有页面统一用"第几周"标注时间,后来发现人对"1月30号那周"的感知远比"W05"直观。所以主题页中改为"01/30(2026-W05)",文件名保持不变。
写在最后
这个知识库从搭建到全量编译完成,前后花了两天。核心工作量不在编码——实际上几乎没有写代码——而在于想清楚架构和规则。CLAUDE.md 就是那个关键的"想清楚"的产物。
有了这个体系,后续维护的成本极低:每周新资料丢进 raw/,说一句"编译最新的",几分钟就完成了。查询更是即时的。
如果你也在长期跟踪某个信息源(不限于投资),积累了大量资料却苦于无法系统化,这个方法值得一试。核心思路就三点:
- 想清楚分类体系——不要什么都放一个地方
- 写好编辑手册——让AI按你的规矩干活
- 忠实记录还是可衍生创造?——某些严肃场景(比如本文案例),AI是编辑,不是分析师
本文基于真实操作记录,使用 Claude Code + 本地文件系统 + 飞书知识库搭建。
夜雨聆风