你的AI编码助手总在失忆?这款工具让它过目不忘

每次打开一个新的编码会话，你是不是都要重复解释一遍项目架构？

“认证用的是JWT，中间件在 src/middleware/auth.ts，测试在 test/auth.test.ts，选 jose 是为了Edge兼容性……”

你的AI代理每次都会认真听，然后会话一结束，它就忘得一干二净。

内建的 CLAUDE.md 或者 .cursorrules 能存点东西，但上限200行，而且很快就过时了。你反复发现同样的bug，反复教同样的偏好，反复复制粘贴同样的上下文。

累不累？

什么是 agentmemory？

agentmemory 是一个记忆服务器，在后台静默捕获AI代理的一举一动，压缩成可搜索的记忆，下次会话开始时自动注入正确的上下文。

一条命令。跨所有代理工作。

说白了，就是让你的AI编码助手拥有长期记忆。

30秒体验一下

打开终端1，启动服务器：

npx @agentmemory/agentmemory

打开终端2，注入示例数据并看它怎么召回：

npx @agentmemory/agentmemory demo

demo会注入3个真实会话（JWT鉴权、N+1查询修复、限流），然后对它们执行语义搜索。当你搜“数据库性能优化”时，它会找到“N+1查询修复”——普通的关键词匹配做不到这一点。

打开浏览器访问 http://localhost:3113，你能实时看着记忆是怎么被构建的。

它能做什么？

自动捕获，零人工干预

每次工具调用、每次文件访问、每次错误，都被自动记录下来。你不用再手动 add() 任何东西。

语义搜索，不止关键词

BM25 + 向量嵌入 + 知识图谱，三种检索方式融合。你问“数据库性能优化”，它能理解你真正要找的是“N+1查询修复”。

多代理共享记忆

Claude Code、Cursor、Gemini CLI、Codex、OpenCode……所有代理共享同一个记忆服务器。你在Claude Code里教会的偏好，Cursor那边直接就知道。

实时查看器

端口3113打开一个可视化界面，你可以看到记忆的构建过程、会话回放、知识图谱。甚至支持播放/暂停、调速、键盘快捷键。

记忆会演化，也会遗忘

4层记忆整合（工作记忆→情景记忆→语义记忆→程序记忆），灵感来自人脑。记忆随时间衰减（艾宾浩斯曲线），频繁访问的强化，陈旧的自动清除，矛盾的会被检测并解决。

隐私优先

API key、密钥、被 <private> 标签包裹的内容，在存储前会被剥离。

兼容多少代理？

几乎所有主流AI编码代理都支持。只要支持 hooks、MCP 或 REST API 就能接。

已经验证过的包括：Claude Code、Codex CLI、Cursor、Gemini CLI、OpenCode、Cline、Goose、Aider、Claude Desktop、Windsurf、Roo Code、Kilo Code、pi、Hermes、OpenClaw、Qwen Code、Antigravity、Kiro……

一个服务器，所有代理共享记忆。

跟内建记忆比一下

	内建 (CLAUDE.md)	agentmemory
规模	200行上限	无限
搜索	把所有内容加载到上下文	BM25+向量+图，只取Top-K
Token成本	240条观测达22K+ tokens	约1,900 tokens（省92%）
跨代理	每个代理一个文件	MCP + REST，任何代理
可观测性	手动读文件	实时查看器 (端口3113)

基准测试数据

在内部语料库 coding-agent-life-v1 上：

**Top-5命中率 100%**，精度比grep基线高 2.2倍
延迟：14毫秒

在 ICLR 2025 的 LongMemEval-S（500个问题）上：

R@5: **95.2%**（对比纯BM25回退的86.2%）
R@10: 98.6%

Token成本：每年约170K tokens，按现行价格约 $10/年。如果使用本地嵌入（all-MiniLM-L6-v2），成本为0。

对比 mem0（53K星）、Letta（22K星）等同类项目，agentmemory在检索准确率、多代理协调、框架锁定、外部依赖数量上都有明显优势。详细对比表在项目文档里。

怎么装？

全局安装（推荐）：

npm install -g @agentmemory/agentmemory
# macOS/Linux 如果遇到权限错误，加 sudo

然后：

agentmemory                    # 启动服务器
agentmemory demo               # 注入示例
agentmemory connect claude-code   # 连接你的代理

如果你不想全局安装，用 npx 也行：

npx @agentmemory/agentmemory

从 v0.9.16 开始，首次运行 npx 会内联提示你全局安装，回答 Y 即可。

连接代理的典型配置

以 Cursor / Claude Desktop / Cline 这类使用 mcpServers 结构的代理为例，在配置文件中加入：

"agentmemory": {
"command": "npx",
"args": ["-y", "@agentmemory/mcp"],
"env": {
"AGENTMEMORY_URL": "http://localhost:3111"
  }
}

Gemini CLI 用户可以用 gemini mcp add agentmemory npx -y @agentmemory/mcp。

Aider 用户直接调 REST API。

Codex CLI 除了 MCP，还支持完整的插件（6个生命周期hooks + 4个 skills）。

每个代理的具体接入方式，项目文档里都有详尽说明。

额外的好东西

会话回放：在查看器里选择 Replay 标签，可以回放整个会话的提示词、工具调用、工具结果、响应，支持调速和单步。还能导入已有的 Claude Code JSONL 记录。

iii 控制台：端口3114（默认）打开一个更底层的运维界面，能看到每个记忆操作的 OpenTelemetry traces、每个 KV 条目、每个函数的调用负载。甚至可以编辑卡住的整合计时器，重放一个 hook 调用。

扩展能力：agentmemory 本身就是基于 iii 框架构建的。通过 iii worker add 一条命令，就能增加定时任务、持久队列、沙箱执行、多实例同步等能力。

小结

你每次会话的前5分钟都在重新解释技术栈。agentmemory 在后台运行，彻底消除这件事。

捕获工作内容 → 压缩为结构化记忆 → 下次会话自动注入。

让AI代理真正“记住”你的项目，而不是每次从零开始。

项目地址：github.com/rohitg00/agentmemory

文档：agent-memory.dev

安装命令：npm install -g @agentmemory/agentmemory