AI 编程助手总失忆?三款＂记忆工具＂横评,但它们其实根本不在一个赛道

每天打开 Cursor 或 Claude Code，第一件事是什么？

重新解释一遍项目。

package.json 在哪、这个函数上礼拜刚从同步改成异步、那个支付回调的逻辑别动它有坑、用户偏好返回结构用 JSON 不要用 YAML——这些你上周说过、上上周也说过的话，新会话一开，全部清零。AI 看你的眼神，像个第一次见你的实习生。

所以"给 AI 编程助手装个记忆"这件事，2026 年彻底炸了。GitHub 上几个主流的 MCP 合集仓库 (像 punkpeye/awesome-mcp-servers,9 万多颗星) 里，记忆与知识类 server 已经单独成了一大分类;MCP 协议发布一年多，生态里的 server 数量从最初的几十个涨到了近万个，被叫作"AI 领域的 USB-C"。

重点是另一句：

你以为在横评三款记忆工具，其实它们根本不是一类东西。

Supermemory、PMB、zen-mcp-server，名字都被塞进"AI 记忆工具"这个榜单里，但一个管"AI 跨会话记住你",一个管"AI 理解项目脉络",一个干脆不记东西、只做多模型协作。把它们放一起比基准分，就像拿冰箱、微波炉、电视机比谁的制冷强。

先把这层窗户纸捅破，再讲怎么选。

一、先分清：你要治的，到底是哪种"病"

很多人上来就问"哪个记忆工具最好"。先别急着问。你的 AI 到底得了什么病，得先搞清楚。

大概分三种。

第一种，失忆。 会话一关，啥都不记得。下次开，得从头认识你和你的项目。这是最普遍的痛点。

第二种，找不到东西。 项目文档、代码库、设计稿堆成山，AI 每次都得你手动喂，或者它瞎翻。这是检索问题。

第三种，单打独斗。 Claude 写代码很强，但有时候你想要 Gemini 看一眼图、想让 O3 做个硬核推理、想让 Grok 挑个刺。一个模型干不完所有事。

这三种病，对应三种完全不同的工具。大多数人把它们搅在一起，所以越选越晕。

这里有个特别关键、也特别容易被忽略的区分，来自 Supermemory 创始人 Dhravya Shah 死咬住的一句话：

记忆不是 RAG。

RAG 检索的是文档。你问"React 怎么写 effect",我问也是同一段官方文档，它对所有用户都一样，是死的、静态的、只增不减的。

记忆检索的是事实,而且是会变的事实。"我上个月住纽约，这个月搬到了旧金山",新的会覆盖旧的;"我明天有考试",后天就该被忘掉。

这个差别，一句话就能讲准：

RAG 让 AI 知道世界，记忆让 AI 假装自己活过。

一个解决"信息缺失",一个解决"主体断裂"。搞清楚你要的是哪个，比记住任何参数都重要。

二、选之前，先看懂撑起这个赛道的三根力

只看功能清单，会越看越乱：云的、本地的、通用的、专精项目的、单模型的、多模型的，十几个名字四根轴拉来拉去。

我不打算给你列清单，换个角度问：这个赛道，背后到底靠什么撑着？

钻到底，就三根力。一根都不能少，彼此还不能替代。

第一根：状态得外置 (在不在)

大模型本身没有记忆。这不是 bug，是它本来就这样，上下文窗口一关，上一秒聊过的全忘，连改都改不了。

记忆只能搬出去，放在模型外头某个地方。云端把它放在别人的机器上，PMB 把它放在你硬盘上的一个 .db 文件，codebase-memory 把它编进一张知识图谱，MCP server 就是这些"外面"和模型之间那根线。

这根是门票的门票。没有"外置",云和本地不分家，SQLite 文件不存在，知识图谱不存在，MCP 协议连存在的理由都没有。

第二根：留下来的得取得回 (用得起)

放出去不算完，得取回来，还得用得起。

token 不是白给的。模型窗口就那么大，把记忆全塞回去，一来塞不下，二来塞满了真活儿没法干。Supermemory 的自动遗忘、codebase-memory 官方说能省 99% 的 token、PMB 的 recall 只取相关的几条，全是在干同一件事：从一大堆放出去的状态里，挑出此刻用得上的那一小撮，扔给模型。

第一根回答"放哪",这根回答"怎么用得起"。你可以放得很好，可取不回来，那这堆记忆就是一座进不去的仓库。

第三根：这堆记忆归谁 (敢不敢)

外置解决了放哪，取得回解决了用得起，还剩一根谁都绕不过：这一堆状态，到底归谁，放哪台机器，谁碰得谁碰不得。

云和本地的分家、Apache 2.0 一分不收和每月 19 美元的分家、安全研究里披露的 MCP 工具投毒和权限滥用这类隐患、企业能不能用个人敢不敢交，全是这根在驱动。PMB 把整本记忆装进一个 SQLite 文件，你删了它就没了，谁也拿不走;Supermemory 把它放在云上，换来了更强的能力，可那堆东西在别人机器上跑。

表面看是技术分歧，底下其实是信任落在哪的分歧。

三根立住，浓缩成一句话：

记忆工具好不好，不看星多不多、基准分高不高，就看三样——东西放没放出去 (在不在)、放出去的取不取回 (用得起)、取回的你敢不敢交 (敢不敢)。

后面三款工具，全部用这三根力去拆，一拆就明白。

三、三款工具，逐一拆给你看

1. Supermemory:云端全能王者

一句话:创始人 Dhravya Shah 做的 AI 记忆引擎，GitHub 27.9k 星，这个赛道目前商业化最成熟的一个。

核心参数:

学术榜单 LongMemEval 81.6%,全场第一,另外 LoCoMo、ConvoMem 也是第一。三款里唯一登顶公开学术基准的。换句话说，它最不容易记错事，也最会处理"你上个月说 A、这个月改口 B"这类前后矛盾的事实。
3 个 MCP 工具：memory(存/遗忘，AI 自动调用)、recall(搜记忆 + 返回用户画像)、context(对话开始注入完整画像，在 Cursor/Claude Code 里输 /context 触发)。

它能干什么:事实抽取 + 追踪更新 + 自动消解矛盾 + 自动遗忘 + 用户画像。还有一堆 Connectors，能实时同步 Google Drive、Gmail、Notion、GitHub。说白了，它不光记，还会自己判断哪条该留、哪条过期了、哪两条打架了。

定价:Free $0(约 $5 额度)、Pro $19/月 (3M token + 10 万次查询)、Scale $399/月 (无限存储 + 10 队友 + 全部连接器 + SOC2/HIPAA)、Enterprise 定制。Context Extender 每对话送 2 万 token 免费，超出 $1/百万 token。

怎么装:想用云的直接注册;想自托管，一行命令：

curl-fsSL https://supermemory.ai/install | bash
# 或
npx supermemory local

单二进制零配置，可以指向 Ollama(gpt-oss:20b) 完全离线，数据存在 ./.supermemory。支持 Claude Desktop/Code、Cursor、Windsurf、VS Code、OpenCode 等主流客户端。

主要缺点:

云优先的产品基因。能自托管，但自托管版的能力和托管版有差距 (那 81.6% 的分不会自己掉下来给你用)。
企业档贵。个人玩玩 Pro 够，真要团队上，Scale 一年小 5 万人民币。

用三根力拆:外置到云，取回用学术榜撑，归属让渡给服务商。能力强，代价是信任得交出去一部分。

2. PMB:把项目记忆装进一个 SQLite 文件

一句话:开发者 oleksiijko 做的本地项目记忆库，Apache 2.0 完全开源免费，把"记忆"重新定义成了"项目叙事"。

核心参数:

prepare(message) 调用 4–16 毫秒返回，recall(query) 混合搜索 35 毫秒(warm 状态)。快到几乎感觉不到。
一共提供 prepare、recall,外加 27 个 CLI 工具，覆盖项目记忆的各种粒度。

它能干什么:这是 PMB 最有意思的地方。它不只是一堆事实，而是用 lessons(规则)、decisions(决策)、open_goals(进行中的目标)、narrative_arcs(叙事弧)、entities(实体) 五种东西，让 AI 真正"理解"你的项目脉络，而不是只存几条孤立事实。

官方有个 Demo 特别直观：

你说"修复上周二遇到的那个 LoadGuard 定价 bug"。没有 PMB,AI 会反问："哪个文件？bug 是什么？"有 PMB,prepare() 6 毫秒返回，直接定位到 src/engine/verdict-policy.ts:142(bundle fallback 收紧到 rate-floor 以下),按之前存的 lesson 恢复 25% 阈值，不用反问。

怎么装:

pip install pmb-ai
# 或
npx pmb-ai setup

纯本地，无云、无 API key、无遥测、无网络调用。数据就是一个 SQLite 文件，你的硬盘你做主。

主要缺点:

比较新的项目，星标数远低于 Supermemory(README 用 badge 没显示具体数字),社区和踩坑资料还在积累。
没有公开学术基准，能力上限受你自己算力和工程量限制，你要自己搭、自己维护。

用三根力拆:外置到本地 SQLite + 取回靠 lessons/recall + 归属完全归你。控制权拉满，代价是能力天花板得自己扛。

3. zen-mcp-server:诚实说，它不是记忆工具

一句话:BeehiveInnovations 出品，GitHub 11.6k 星、924 forks，本质是一个多模型编排层,让 Claude Code 同时跟 Gemini 2.5 Pro、OpenAI O3、Grok、Ollama 协作。它不是记忆工具,我把它放进来，当个对照组，顺便说清楚一个常见的误会。

核心参数:13+ 个 MCP 工具，chat、thinkdeep、challenge、planner、consensus、codereview、precommit、debug、secaudit 等等。

它真正在解决什么:

challenge,专门防止 AI 那种"You're absolutely right!"式无脑附和，让它真的去挑刺。
consensus,让多个模型对同一个问题做共识分析。
它所谓的"上下文保持",指的是跨模型协作时维持对话连续性,不是长期事实记忆。

怎么装:用 uvx,需要自带至少一个 API key(Gemini/OpenAI/X.AI 等)。

uvx --fromgit+https://github.com/BeehiveInnovations/zen-mcp-server.git zen-mcp-server

主要缺点(必须说清楚):

它不存记忆。别拿 LongMemEval 这种记忆基准去比它，那是关公战秦琼。它的"上下文"是对话线程，会话结束就没了。
要用得顺手，得准备好几个模型的 API key，有成本也有门槛。

用三根力拆:它三根里一根都不沾，不外置、不取回、不争归属。所以它压根不该被算进记忆工具榜。把它列进来，正好反证这三根力的硬度。

如果你真正的痛点是"Claude 单模型不够用、想要多模型协作 + 防附和",选它没毛病。如果你要的是"AI 记住我",它帮不上。

四、避坑指南 (这些坑我替你踩过了)

推荐完了，再说说哪些不推荐、哪些要小心，免得你走弯路。

坑一：别把 zen-mcp-server 当记忆工具硬比。 这是最常见的错误。很多榜单把它和 Supermemory 摆一起比基准分，纯属外行。懂行的读者一眼就能看出来，你写了反而掉价。它解决的是协作，不是失忆。

坑二:PMB 和 claude-memory-mcp 是两个东西，别搞混。 GitHub 上有个 WhenMoon-afk 做的 claude-memory-mcp,经常被误当成 PMB。它也是本地优先 (SQLite 存 5 种 artifact:snapshot/decision/project_state/bundle/meta_snapshot),定位"刻意无趣的基础设施",但它的模型不如 PMB 的 narrative_arcs 丰富。两个项目，别张冠李戴。

坑三：三款之间没有直接头对头基准。 这是必须坦诚的数据缺口。Supermemory 有自己的 MemoryBench(对比 Mem0、Zep),但既没包含 PMB，也没包含 zen-mcp-server。市面上没有任何第三方，用统一指标对这三款做过 token 消耗、响应延迟、记忆准确率的横评。所以任何"谁碾压谁"的结论，都得打个问号。

坑四:Supermemory 自托管 ≠ 托管版。 你看到 81.6% 那个分，是人家云端引擎跑出来的。你自己 npx supermemory local 起一个，接 Ollama 的开源模型，效果是要打折的。别指望本地白嫖到顶配。

坑五:PMB、zen 的中文一手实测几乎空白。 国内社区对 Supermemory 还有点 B 站实测，另外两个基本没人正经测过，多是搬运介绍页。真要用，做好自己当小白鼠的准备。

五、横向对比矩阵

把三款放一张表里，看着清楚。左右滑动查看。

维度	Supermemory	PMB	zen-mcp-server
本质	云端记忆引擎 (可自托管)	本地项目记忆库	多模型编排层
解决的问题	AI 跨会话记住你	AI 理解项目脉络	多模型协作 + 防附和
存储	云 (默认)/ 本地 (自托管)	单个本地 SQLite 文件	不持久化记忆
是否开源	MCP server 开源，引擎部分闭源	完全开源 (Apache 2.0)	完全开源 (Apache 2.0)
隐私	云优先 (可全离线 Ollama)	纯本地，无遥测	本地进程，外部 API 有日志
定价	$0 / $19 / $399 / 定制	免费	免费 (付 API key 费)
学术基准	LongMemEval 81.6% #1	无	无 (非记忆工具)
响应速度	云端调用	prepare 4–16ms	取决于调用模型
GitHub Stars	27.9k	较新，星少	11.6k
记忆模型	事实抽取 + 遗忘 + 消解 + 画像	lessons/decisions/叙事弧	不记忆
适合谁	团队/企业/跨工具通用记忆	个人/隐私敏感/单项目深度	多模型协作需求

六、选型决策树

看完表格还是晕？给你一个最简单的决策路径。

先问自己一个问题：你最主要痛点是哪个？

"我的 AI 老忘事，我要它跨会话记住我和项目" → 这是真·记忆需求。再往下分：

你是团队、要跨多个工具 (Cursor、Claude、Notion) 通用记忆、有预算、能接受云端 → Supermemory Pro 起步。
你是个人开发者、对数据主权敏感、主要在单个项目里深挖、不想花一分钱 → PMB。

"我不缺记忆，我缺的是 Claude 一个人干不过来，想要多模型协作、有人挑刺" → zen-mcp-server,但它不解决记忆问题，别指望。

这里还有个更狠的判断，来自前面那台"控制力 × 能力上限"的小仪器。

把所有记忆工具放进一个二维坐标:X 轴是控制力 (全攥自己手里 → 全交出去),Y 轴是能力上限 (只记得一点 → 顶配)。

右上角 (能力顶 + 控制全交):Supermemory 托管版。学术第一，自动遗忘消解都最精，但东西在别人机器上，MCP 工具投毒这类安全风险大半落这格。
左上角 (能力顶 + 控制全攥):PMB、自托管的 codebase-memory。开源免费断网能跑，但能力上限被你自己算力卡住。
左下、右下两格:要么攥得紧但记得少 (claude-memory-mcp),要么交一半换回的能力也一般 (Mem0/Zep 这类)。

2026 年的战火，集中在右上和左上那条对角线上,Supermemory 把能力做到顶，PMB 把控制权攥到死，各自把一格做到极致。中间那两格空着。

这台仪器告诉你一句狠话：控制力和能力上限，现在还拉不到一头。 你要控制，就得以能力为代价;你要顶配能力，就得把控制权交出去。这不是哪个工具做得不够好，是这条赛道在"归属权"这根力上，谁也没松口。

所以选型这件事，你选的不是"最好的",而是"你愿意交出哪一样"。

七、收尾：先用免费的，验证你的需求是不是真刚需

说几句实在的。

记忆工具这个赛道，现在还非常早期。一边是 MCP 协议发布一年多生态 server 涨到近万个、Anthropic 把协议治理权交给了新成立的 Agentic AI Foundation、Google 微软 AWS 全跟进，热闹得很;另一边是"MCP 凉了"的争议此起彼伏、安全研究里陆续披露 MCP 工具投毒和权限滥用这类隐患、各家基准各说各话。繁荣和泡沫，现在摞在一起。

往深了说一句。前面那个"记忆不是 RAG"的区分，再往下钻，其实有个更冷的真相：所有这些工具做的，严格说都只是 recall(回忆),不是 continuity(连续)。真正的连续性，是那个还活在内存里、还在流淌的上下文窗口本身;一旦它断了，你从笔记里重建出来的，只是一个模仿者，不是本人。

记忆这件事，本质是给一个没有时间的东西，假装它有时间;给一个每次都从零开始的函数，假装它是同一个人的一生。

这套哲学，该放就放，别让它挡住你干活。

所以我的建议很务实:别一上来就冲 Supermemory 的企业档。先用 PMB(本地、免费、6 毫秒) 或者 zen-mcp-server(免费、防附和),花一个礼拜，验证一下"AI 失忆"到底是不是你真天天踩的坑。是，再考虑要不要为更强的能力，把信任交出去。

东西放没放出去、放出去的取不取回、取回的你敢不敢交，这三件事想清楚了，选哪个，你自己就有答案。

有你在用的记忆工具我没提到，或者踩过别的坑，评论区聊聊。