AgentMemory:让 AI 编程助手真正记住你

Claude Code 已经有自带的 Auto Memory，但规模一大就露出短板。这个开源工具补上了检索能力和跨工具共享，是自带记忆的进阶替代方案。

核心数据： LongMemEval 召回率 95.2% | 51 个 MCP 工具接口 | 支持 16+ AI 助手

背景：Claude Code 已经有记忆了，还需要这个吗？

先说一个容易被忽略的事实：Claude Code 其实已经有自带的持久记忆功能。

Auto Memory 让 Claude 在会话中自动把发现的有用信息写入 MEMORY.md，不需要开发者手动维护。Auto Dream 则在会话后后台自动整理：合并重复条目、删除矛盾事实、把"昨天决定用 Redis"转换成带绝对日期的记录。

所以问题变成了：自带的够用吗？

对于轻度用户，够了。但随着项目积累，三个结构性问题会浮现：

1. Token 膨胀：MEMORY.md 在累积 240 条观测后，会把 22,000+ tokens 塞进每次会话的上下文；agentmemory 同等数据只用 1,900 tokens，节省 92%。到 1,000 条观测时，内置记忆有 80% 会因为超出窗口而变得不可见。

2. 没有检索：auto memory 没有搜索能力，Claude 是线性读取 MEMORY.md 后自己决定要不要打开话题文件——本质上还是在 grep 一个 Markdown 文件。

3. 记忆不跨工具：如果你同时用 Claude Code 做重构、Cursor 做补全、Codex CLI 跑脚本，三者之间没有共享记忆，每个助手每次都要从头建上下文。

AgentMemory 针对的正是这三个问题，而不是"有没有记忆"本身。

AgentMemory 是什么？

AgentMemory 是一个专为 AI 编程助手设计的持久记忆系统，在 GitHub 上以「基于真实世界 Benchmark 的 AI 编程助手 #1 持久记忆」为口号发布。

它把 Karpathy 提出的 LLM Wiki 模式延伸升级，加入了置信度评分、生命周期管理、知识图谱和混合检索——AgentMemory 是这套架构的完整工程实现。

现有的 AI 编程助手自带的记忆（Claude Code 的 MEMORY.md、Cursor 的 notepads）就像便利贴，好用但有限。AgentMemory 是便利贴背后那个可搜索的数据库。

记忆是如何工作的？

AgentMemory 受人类大脑记忆巩固机制启发，将信息处理分为三个阶段：

① 实时观测（工具调用后触发）

SHA-256 去重 → 隐私过滤（剔除 API 密钥等敏感信息）→ 存储原始观测 → LLM 压缩提取结构化事实、概念和叙述

② 会话结束时的"睡眠巩固"

会话摘要 → 知识图谱抽取 → 向量嵌入（支持 6 家提供商 + 本地模型）→ 同步写入 BM25 索引和向量索引

③ 新会话时的上下文注入

加载项目档案（核心概念、常用文件、代码模式）→ 三路混合检索 → Token 预算控制（默认 2000 tokens）→ 注入对话

三路混合检索（Hybrid Search）

融合三种检索方式，并用 RRF 算法重排结果：

BM25 关键词检索
— 词干提取 + 同义词扩展，支持中文、希腊文、西里尔文等多语言
向量语义检索
— 基于嵌入向量的语义相似度，捕获意图而非字面匹配
知识图谱遍历
— 挖掘实体间关系，补充单纯关键词/向量检索遗漏的关联信息
置信度衰减评分
— 综合新鲜度、访问频率、置信度对结果重打分

Benchmark 表现

方案	LongMemEval-S R@5
AgentMemory（混合检索）	95.2%
BM25 单路基线	86.2%

支持哪些 AI 编程助手？

AgentMemory 同时支持 Hooks、MCP 协议和 REST API 三种接入方式，几乎覆盖了市场上所有主流 AI 编程工具：

Claude Code Cursor Gemini CLI Codex CLI Cline Windsurf Aider Goose Kilo Code OpenCode Roo Code Hermes 任意 MCP 客户端

所有助手共用同一个记忆服务器，记忆跨工具互通——你在 Cursor 里讲的架构决策，Claude Code 也能记住。

三行命令，立即开始

AgentMemory 做到了真正的零配置启动，不需要外部数据库，数据默认存储在本地：

# 1. 全局安装（推荐）npminstall-g @agentmemory/agentmemory# 2. 启动记忆服务器（端口 3111）agentmemory# 3. 连接你的 AI 助手（以 Claude Code 为例）agentmemory connect claude-code# 打开浏览器，实时观察记忆构建过程# → http://localhost:3113

安装完成后，访问 http://localhost:3113 可以看到一个实时可视化面板，包含：实时观测流、会话浏览器、记忆浏览器、知识图谱可视化和健康状态仪表盘。

几个值得关注的设计亮点

🔒 本地优先，数据不出境

所有记忆数据默认存储在用户本地机器，无需外部数据库。隐私过滤在写入前自动剔除 API 密钥、密码等敏感信息，并支持配置 AGENTMEMORY_SECRET 保护访问。

💰 Token 节省计算器

内置 Token 消耗统计，agentmemory status 命令实时显示累计节省的 Token 数量和等价美元成本（按 $0.30/1K tokens 计算）。持久记忆本质上减少了每次重复解释带来的 Token 消耗。

🔭 OpenTelemetry 全链路追踪

每一次记忆操作都作为 OpenTelemetry trace 记录，在控制台中可以看到 BM25 扫描 → 向量检索 → RRF 融合 → 重排序的完整瀑布图，支持导出到 Jaeger、Honeycomb、Grafana Tempo。

总结

Claude Code 的 Auto Memory 已经解决了「有没有记忆」的问题，AgentMemory 解决的是下一层：记忆多了怎么办、怎么检索、多个工具怎么共享。

如果你只用 Claude Code、项目不大、会话数不多——自带的 Auto Memory 完全够用，不需要额外折腾。

如果你同时使用多个 AI 工具、项目积累了大量上下文、或者对 Token 消耗比较敏感，AgentMemory 值得认真评估。

项目地址： github.com/rohitg00/agentmemory安装命令： npm install -g @agentmemory/agentmemory

感兴趣的话，赶紧安装上试试吧~