AI编程助手每次会话都失忆?我试了两个开源记忆系统,结论是不用二选一

你有没有过这种经历？

用 Claude Code 重构了一个模块，跟它反复讨论了三次架构设计，终于达成共识。关掉终端吃个饭回来，再打开一个新会话，它对你说的第一句话是：

"你好，需要我帮你做什么？"

仿佛刚才是跟你讨论架构细节的，是另一个 AI。

这其实不怪模型。Claude Code 也好、Cursor 也好、Codex 也好，它们在设计上都是无状态的——每次新会话都是一张白纸。你期待它记得你30分钟前说过的话，但它的记忆就只到上一条消息。

2026年之前，这事儿基本无解。要么你把每件事写到 CLAUDE.md（200行就满了），要么就每次重说一遍。但今年不一样了，一批专门给 AI agent 做记忆的开源工具爆发了。

我翻了 GitHub 上的数据，挑了两个最值得说的——MemPalace（⭐55,754）和 AgentMemory（⭐23,173）。各自写代码的方式不同、设计哲学也不同，但解决的是同一个问题：让你的 AI agent 记得你是谁。

不解决这个问题的代价有多大？

先说个具体的场景。

你是一个全栈工程师，项目里用了 JWT 做认证，所有中间件写在 `src/middleware/auth.ts`，用的是 `jose` 库而不是 `jsonwebtoken`，因为你要兼容 Edge Runtime。

你的第一轮会话：你：帮我写个认证中间件。AI：好的。（开始写）第二轮会话（吃完午饭回来）：你：帮我加上 JWT 认证。AI：好的。（重新写一遍，甚至可能用 `jsonwebtoken`）你：不，我们用 `jose`。AI：好的。（重写）第三轮会话（第二天）：你：帮我把认证中间件加上 rate limiting。AI：好的，我先看看项目里用了什么认证方案…

你猜它要多久才能重新搭好背景？还不一定搭得对。

这种摩擦看着不大，但乘以每天几十次会话，一年下来浪费的时间是个天文数字。

AgentMemory 的 README 里算了一笔账：

- 每次都贴完整上下文 → 一年 1950 万 token，根本放不下

- 用 LLM 总结历史 → 一年约 65 万 token，花约 500 美元

- 用 AgentMemory → 一年约 17 万 token，花约 10 美元

- 用 AgentMemory + 本地嵌入模型 → 17 万 token，0 美元

这个数字对比放在那，一天多花个几块钱你可能不在意，但累积起来的摩擦成本才是最贵的——你每多花 30 秒解释背景，你的心流就断一次。

所以社区今年集中精力做了两件事：要么把记忆做得更准，要么让接入变得更简单。MemPalace 走的是"准"的路，AgentMemory 走的是"简单"的路。

MemPalace：把记忆做成了宫殿

MemPalace 这个名字取得很好——它把记忆做成了真的"宫殿"架构。

创始人把信息分为三种：wings（人和项目）、rooms（主题）、drawers（原始内容）。搜索的时候可以从任意一层切入，然后逐层精确定位，而不是在扁平的海量数据里大海捞针。

这种设计的好处是：搜索有 scope。你搜"为什么选 GraphQL"只会查 architecture 房间里的内容，不会把整个项目的 commit 历史、issue 讨论全搅进来。

它的底层技术也很硬核。MemPalace 使用的是 ChromaDB 作为默认向量数据库，支持插拔式替换——你换成 Qdrant 或者 pgvector 都行。在 LongMemEval（一个专门测记忆系统的大规模 Benchmark，500 个问题）上，它的得分是：

- 纯语义搜索（不需要任何 API 调用）：R@5 96.6%

- Hybrid v4 混合检索（关键词 + 时间 + 偏好模式）：R@5 98.4%

- Hybrid v4 + LLM rerank：≥99%

96.6% 这个数字让我很惊讶——因为这意味着在不用任何 LLM、不调用任何云端 API、纯本地向量检索的情况下，每 30 条记忆里只有 1 条没出现在前 5 个结果里。这是真正的"离线可用"。

我还注意到它特别提醒用户：Claude Code 的会话 30 天后自动过期，如果没有自动保存 hook，你的记忆就没了。这说明它做过大量真实用户场景的测试。

安装也很简单：

uv tool install mempalacemempalace init ~/projects/myapp

然后配一个 MCP server 就能接入 Claude Code。

但 MemPalace 有个问题——它没有真正的"自动捕获"。你得手动 `mempalace mine` 去扫描项目，或者手动起 MCP server 让它记录。对于习惯"丢后台就不用管"的用户来说，这个门槛会让它吃灰。

### AgentMemory：从"需要手动记"进化到"自己记"

AgentMemory 是另一个思路。它不做"最准的记忆引擎"——它做的是"最容易接入的记忆系统"。

安装只需要一行：

npm install -g @agentmemory/agentmemoryagentmemoryagentmemory connect claude-code

然后你的 Claude Code 就拥有了持久记忆。自动的。

AgentMemory 的 README 列了一个很漂亮的表格，覆盖了当前主流的所有 AI 编程工具——Claude Code、Codex CLI、Cursor、GitHub Copilot CLI、Gemini CLI、Hermes、OpenClaw、pi、OpenCode、Windsurf、Cline、Goose、Aider，甚至 Warp。这 20 多个 agent，它全部通过 MCP server 接入，一个共享的记忆后端。

它的核心突破是 12 个自动 hook。什么意思？你的 agent 每做一次代码变更、每查一个文件、每完成一个任务，它自动捕获关键信息存入记忆库。你不需要手动 `add()`，不需要记着去执行记忆命令。对用户来说，记忆是"顺便发生的"。

在检索准确率上，AgentMemory 跑出了 95.2% R@5（LongMemEval-S），比 MemPalace 的 96.6% 略低。但差值只有 1.4%，在实际使用中几乎感知不到差别。

它的安装包也很轻——0 个外部数据库依赖（用 SQLite + iii-engine 做底层），53 个 MCP tools，1423+ 个测试用例。这些都是开源项目的"诚实指标"——测试多说明工程化做得好，不会半夜更新后崩掉。

不过它的弱点是运行成本：它需要一个持续运行的 MCP server（监听 3111 端口），意味着你要在开发机上跑一个后台进程。对于只在写代码时开机的用户，这倒不是大问题。对于笔记本党，多跑一个 Node 进程意味着电池又多了一分压力。

我该用哪个？

直接说结论吧，分场景：

你在一个长期项目上、agent 会话频繁、项目中经常需要跨模块推理、团队成员也要共享上下文的 → 入 AgentMemory。它的"自动 hook"机制对这个场景是降维打击——你不用改变任何习惯，它自己就把上下文维护好了。12 个 hook 覆盖了大部分常见 agent 操作，你不会忘记保存记忆。

你在做研究/实验项目、经常换模型和框架、对检索准确性要求极高的 → 入 MemPalace。它的 wings-rooms-drawers 架构对于管理复杂的技术记忆非常合适，而且纯本地的 96.6% 准确率意味着你不需要为记忆功能付任何云端费用。

两个都装呢？ 这也许是今年最让我意外的发现——两套系统居然可以同时跑。AgentMemory 作为默认的自动记忆层（不费脑子），MemPalace 作为深度的"搜旧档"引擎（需要的时候主动搜）。AgentMemory 捕获日常会话，MemPalace 做深度检索。两个 MCP server 互不冲突，因为它们的 namespace 不同。

为什么这件事现在突然"可以了"

HN 上昨天（6月16日）有一条帖子爆了——"Running local models is good now"（⭐1,097，446 条评论）。社区的热度说明了一件事：本地部署 AI 的生态终于到了一个转折点。

Qwen3.6-27B 在 MacBook Max M5 上跑到了 30 tok/s、Gemma 4 的 MoE 模型用 20-30GB RAM 就能跑出不错的编程效果。这些进展让"本地 AI"从实验室玩具变成了可用的开发工具。

而记忆系统是"本地 AI"拼图的最后一块。你可以在本地跑模型、在本地存代码、在本地做检索——全部数据不出你的机器。MemPalace 和 AgentMemory 都把"本地优先"作为核心设计目标，你不用把项目里的代码片段上传到云端做向量化。

还有一个数据值得注意——TechCrunch 昨天（6月16日）发表了一项调查：60% 的美国消费者表示品牌文案中出现 "AI" 反而让人反感。用户对 "AI" 这个词本身的疲劳正在加剧，但对 AI 工具的需求在增长。这其中的矛盾其实指向了一个信号：用户不抗拒好工具，抗拒的是"为了 AI 而 AI"。记忆系统这种解决真实痛点的工具，正是在大厂的 AI 疲劳营销中脱颖而出的。

### 不是二选一，而是什么时候用哪个

回到最开始的问题：你的 AI 编程助手每次会话都问候你"需要帮忙吗"，你烦不烦？

如果烦，那你需要的不是更聪明的模型，而是能记住你做过什么的系统。在 Claude Code 的上下文已经足够装下整个中型项目代码的今天，唯一阻止 agent 成为"真正的同事"的，就是它有没有对你上一次代码修改的记忆。

MemPalace 和 AgentMemory 选了不同的路，但方向是一样的。一个把内存做成了宫殿，一个把记忆做成了空气——存在但感觉不到。

我呢？我两个都装了。AgentMemory 兜底，MemPalace 查漏。用它们第三天的时候，Claude Code 的代码风格开始"适应"我的偏好，不再把回调用 `function` 写成箭头函数，不再在 `import` 里用 `type` 前缀。它甚至开始在注释里用我的命名习惯——因为 AgentMemory 记得。

那一刻我才反应过来：过去半年 AI 编程工具最大的进步，不是生成代码的能力，而是终于开始学会闭嘴听你说话了。

References

- MemPalace GitHub: "Local-first AI memory. Verbatim storage, pluggable backend, 96.6% R@5 raw on LongMemEval" - https://github.com/MemPalace/mempalace

- AgentMemory GitHub: "Persistent memory for AI coding agents" - https://github.com/rohitg00/agentmemory

- Vicki Boykis: "Running local models is good now" (HN ⭐1,097 💬446) - https://vickiboykis.com/2026/06/15/running-local-models-is-good-now/

- HN discussion: "Running local models is good now" - https://news.ycombinator.com/item?id=48555993

- TechCrunch: "Sixty percent of US consumers say 'AI' in brand messaging is a turnoff, survey finds" - https://techcrunch.com/

- Voicebox GitHub: "The open-source AI voice studio. Clone, dictate, create." - https://github.com/jamiepine/voicebox

- Hyperframes GitHub: "Write HTML. Render video. Built for agents." - https://github.com/heygen-com/hyperframes