你有没有过这种经历?
用 Claude Code 重构了一个模块,跟它反复讨论了三次架构设计,终于达成共识。关掉终端吃个饭回来,再打开一个新会话,它对你说的第一句话是:
"你好,需要我帮你做什么?"
仿佛刚才是跟你讨论架构细节的,是另一个 AI。
这其实不怪模型。Claude Code 也好、Cursor 也好、Codex 也好,它们在设计上都是无状态的——每次新会话都是一张白纸。你期待它记得你30分钟前说过的话,但它的记忆就只到上一条消息。
2026年之前,这事儿基本无解。要么你把每件事写到 CLAUDE.md(200行就满了),要么就每次重说一遍。但今年不一样了,一批专门给 AI agent 做记忆的开源工具爆发了。
我翻了 GitHub 上的数据,挑了两个最值得说的——MemPalace(⭐55,754)和 AgentMemory(⭐23,173)。各自写代码的方式不同、设计哲学也不同,但解决的是同一个问题:让你的 AI agent 记得你是谁。
不解决这个问题的代价有多大?
先说个具体的场景。
你是一个全栈工程师,项目里用了 JWT 做认证,所有中间件写在 `src/middleware/auth.ts`,用的是 `jose` 库而不是 `jsonwebtoken`,因为你要兼容 Edge Runtime。
你的第一轮会话:你:帮我写个认证中间件。AI:好的。(开始写)第二轮会话(吃完午饭回来):你:帮我加上 JWT 认证。AI:好的。(重新写一遍,甚至可能用 `jsonwebtoken`)你:不,我们用 `jose`。AI:好的。(重写)第三轮会话(第二天):你:帮我把认证中间件加上 rate limiting。AI:好的,我先看看项目里用了什么认证方案…
你猜它要多久才能重新搭好背景?还不一定搭得对。
这种摩擦看着不大,但乘以每天几十次会话,一年下来浪费的时间是个天文数字。
AgentMemory 的 README 里算了一笔账:
- 每次都贴完整上下文 → 一年 1950 万 token,根本放不下
- 用 LLM 总结历史 → 一年约 65 万 token,花约 500 美元
- 用 AgentMemory → 一年约 17 万 token,花约 10 美元
- 用 AgentMemory + 本地嵌入模型 → 17 万 token,0 美元
这个数字对比放在那,一天多花个几块钱你可能不在意,但累积起来的摩擦成本才是最贵的——你每多花 30 秒解释背景,你的心流就断一次。
所以社区今年集中精力做了两件事:要么把记忆做得更准,要么让接入变得更简单。MemPalace 走的是"准"的路,AgentMemory 走的是"简单"的路。
MemPalace:把记忆做成了宫殿
MemPalace 这个名字取得很好——它把记忆做成了真的"宫殿"架构。
创始人把信息分为三种:wings(人和项目)、rooms(主题)、drawers(原始内容)。搜索的时候可以从任意一层切入,然后逐层精确定位,而不是在扁平的海量数据里大海捞针。
这种设计的好处是:搜索有 scope。你搜"为什么选 GraphQL"只会查 architecture 房间里的内容,不会把整个项目的 commit 历史、issue 讨论全搅进来。
它的底层技术也很硬核。MemPalace 使用的是 ChromaDB 作为默认向量数据库,支持插拔式替换——你换成 Qdrant 或者 pgvector 都行。在 LongMemEval(一个专门测记忆系统的大规模 Benchmark,500 个问题)上,它的得分是:
- 纯语义搜索(不需要任何 API 调用):R@5 96.6%
- Hybrid v4 混合检索(关键词 + 时间 + 偏好模式):R@5 98.4%
- Hybrid v4 + LLM rerank:≥99%
96.6% 这个数字让我很惊讶——因为这意味着在不用任何 LLM、不调用任何云端 API、纯本地向量检索的情况下,每 30 条记忆里只有 1 条没出现在前 5 个结果里。这是真正的"离线可用"。
我还注意到它特别提醒用户:Claude Code 的会话 30 天后自动过期,如果没有自动保存 hook,你的记忆就没了。这说明它做过大量真实用户场景的测试。
安装也很简单:
uv tool install mempalacemempalace init ~/projects/myapp
然后配一个 MCP server 就能接入 Claude Code。
但 MemPalace 有个问题——它没有真正的"自动捕获"。你得手动 `mempalace mine` 去扫描项目,或者手动起 MCP server 让它记录。对于习惯"丢后台就不用管"的用户来说,这个门槛会让它吃灰。
### AgentMemory:从"需要手动记"进化到"自己记"
AgentMemory 是另一个思路。它不做"最准的记忆引擎"——它做的是"最容易接入的记忆系统"。
安装只需要一行:
npm install -g @agentmemory/agentmemoryagentmemoryagentmemory connect claude-code
然后你的 Claude Code 就拥有了持久记忆。自动的。
AgentMemory 的 README 列了一个很漂亮的表格,覆盖了当前主流的所有 AI 编程工具——Claude Code、Codex CLI、Cursor、GitHub Copilot CLI、Gemini CLI、Hermes、OpenClaw、pi、OpenCode、Windsurf、Cline、Goose、Aider,甚至 Warp。这 20 多个 agent,它全部通过 MCP server 接入,一个共享的记忆后端。
它的核心突破是 12 个自动 hook。什么意思?你的 agent 每做一次代码变更、每查一个文件、每完成一个任务,它自动捕获关键信息存入记忆库。你不需要手动 `add()`,不需要记着去执行记忆命令。对用户来说,记忆是"顺便发生的"。
在检索准确率上,AgentMemory 跑出了 95.2% R@5(LongMemEval-S),比 MemPalace 的 96.6% 略低。但差值只有 1.4%,在实际使用中几乎感知不到差别。
它的安装包也很轻——0 个外部数据库依赖(用 SQLite + iii-engine 做底层),53 个 MCP tools,1423+ 个测试用例。这些都是开源项目的"诚实指标"——测试多说明工程化做得好,不会半夜更新后崩掉。
不过它的弱点是运行成本:它需要一个持续运行的 MCP server(监听 3111 端口),意味着你要在开发机上跑一个后台进程。对于只在写代码时开机的用户,这倒不是大问题。对于笔记本党,多跑一个 Node 进程意味着电池又多了一分压力。
我该用哪个?
直接说结论吧,分场景:
你在一个长期项目上、agent 会话频繁、项目中经常需要跨模块推理、团队成员也要共享上下文的 → 入 AgentMemory。它的"自动 hook"机制对这个场景是降维打击——你不用改变任何习惯,它自己就把上下文维护好了。12 个 hook 覆盖了大部分常见 agent 操作,你不会忘记保存记忆。
你在做研究/实验项目、经常换模型和框架、对检索准确性要求极高的 → 入 MemPalace。它的 wings-rooms-drawers 架构对于管理复杂的技术记忆非常合适,而且纯本地的 96.6% 准确率意味着你不需要为记忆功能付任何云端费用。
两个都装呢? 这也许是今年最让我意外的发现——两套系统居然可以同时跑。AgentMemory 作为默认的自动记忆层(不费脑子),MemPalace 作为深度的"搜旧档"引擎(需要的时候主动搜)。AgentMemory 捕获日常会话,MemPalace 做深度检索。两个 MCP server 互不冲突,因为它们的 namespace 不同。
为什么这件事现在突然"可以了"
HN 上昨天(6月16日)有一条帖子爆了——"Running local models is good now"(⭐1,097,446 条评论)。社区的热度说明了一件事:本地部署 AI 的生态终于到了一个转折点。
Qwen3.6-27B 在 MacBook Max M5 上跑到了 30 tok/s、Gemma 4 的 MoE 模型用 20-30GB RAM 就能跑出不错的编程效果。这些进展让"本地 AI"从实验室玩具变成了可用的开发工具。
而记忆系统是"本地 AI"拼图的最后一块。你可以在本地跑模型、在本地存代码、在本地做检索——全部数据不出你的机器。MemPalace 和 AgentMemory 都把"本地优先"作为核心设计目标,你不用把项目里的代码片段上传到云端做向量化。
还有一个数据值得注意——TechCrunch 昨天(6月16日)发表了一项调查:60% 的美国消费者表示品牌文案中出现 "AI" 反而让人反感。用户对 "AI" 这个词本身的疲劳正在加剧,但对 AI 工具的需求在增长。这其中的矛盾其实指向了一个信号:用户不抗拒好工具,抗拒的是"为了 AI 而 AI"。记忆系统这种解决真实痛点的工具,正是在大厂的 AI 疲劳营销中脱颖而出的。
### 不是二选一,而是什么时候用哪个
回到最开始的问题:你的 AI 编程助手每次会话都问候你"需要帮忙吗",你烦不烦?
如果烦,那你需要的不是更聪明的模型,而是能记住你做过什么的系统。在 Claude Code 的上下文已经足够装下整个中型项目代码的今天,唯一阻止 agent 成为"真正的同事"的,就是它有没有对你上一次代码修改的记忆。
MemPalace 和 AgentMemory 选了不同的路,但方向是一样的。一个把内存做成了宫殿,一个把记忆做成了空气——存在但感觉不到。
我呢?我两个都装了。AgentMemory 兜底,MemPalace 查漏。用它们第三天的时候,Claude Code 的代码风格开始"适应"我的偏好,不再把回调用 `function` 写成箭头函数,不再在 `import` 里用 `type` 前缀。它甚至开始在注释里用我的命名习惯——因为 AgentMemory 记得。
那一刻我才反应过来:过去半年 AI 编程工具最大的进步,不是生成代码的能力,而是终于开始学会闭嘴听你说话了。
References
- MemPalace GitHub: "Local-first AI memory. Verbatim storage, pluggable backend, 96.6% R@5 raw on LongMemEval" - https://github.com/MemPalace/mempalace
- AgentMemory GitHub: "Persistent memory for AI coding agents" - https://github.com/rohitg00/agentmemory
- Vicki Boykis: "Running local models is good now" (HN ⭐1,097 💬446) - https://vickiboykis.com/2026/06/15/running-local-models-is-good-now/
- HN discussion: "Running local models is good now" - https://news.ycombinator.com/item?id=48555993
- TechCrunch: "Sixty percent of US consumers say 'AI' in brand messaging is a turnoff, survey finds" - https://techcrunch.com/
- Voicebox GitHub: "The open-source AI voice studio. Clone, dictate, create." - https://github.com/jamiepine/voicebox
- Hyperframes GitHub: "Write HTML. Render video. Built for agents." - https://github.com/heygen-com/hyperframes
夜雨聆风