每次打开一个新的编码会话,你是不是都要重复解释一遍项目架构?
“认证用的是JWT,中间件在 src/middleware/auth.ts,测试在 test/auth.test.ts,选 jose 是为了Edge兼容性……”
你的AI代理每次都会认真听,然后会话一结束,它就忘得一干二净。
内建的 CLAUDE.md 或者 .cursorrules 能存点东西,但上限200行,而且很快就过时了。你反复发现同样的bug,反复教同样的偏好,反复复制粘贴同样的上下文。
累不累?
什么是 agentmemory?
agentmemory 是一个记忆服务器,在后台静默捕获AI代理的一举一动,压缩成可搜索的记忆,下次会话开始时自动注入正确的上下文。
一条命令。跨所有代理工作。
说白了,就是让你的AI编码助手拥有长期记忆。
30秒体验一下
打开终端1,启动服务器:
npx @agentmemory/agentmemory
打开终端2,注入示例数据并看它怎么召回:
npx @agentmemory/agentmemory demo
demo会注入3个真实会话(JWT鉴权、N+1查询修复、限流),然后对它们执行语义搜索。当你搜“数据库性能优化”时,它会找到“N+1查询修复”——普通的关键词匹配做不到这一点。
打开浏览器访问 http://localhost:3113,你能实时看着记忆是怎么被构建的。
它能做什么?
自动捕获,零人工干预
每次工具调用、每次文件访问、每次错误,都被自动记录下来。你不用再手动 add() 任何东西。
语义搜索,不止关键词
BM25 + 向量嵌入 + 知识图谱,三种检索方式融合。你问“数据库性能优化”,它能理解你真正要找的是“N+1查询修复”。
多代理共享记忆
Claude Code、Cursor、Gemini CLI、Codex、OpenCode……所有代理共享同一个记忆服务器。你在Claude Code里教会的偏好,Cursor那边直接就知道。
实时查看器
端口3113打开一个可视化界面,你可以看到记忆的构建过程、会话回放、知识图谱。甚至支持播放/暂停、调速、键盘快捷键。
记忆会演化,也会遗忘
4层记忆整合(工作记忆→情景记忆→语义记忆→程序记忆),灵感来自人脑。记忆随时间衰减(艾宾浩斯曲线),频繁访问的强化,陈旧的自动清除,矛盾的会被检测并解决。
隐私优先
API key、密钥、被 <private> 标签包裹的内容,在存储前会被剥离。
兼容多少代理?
几乎所有主流AI编码代理都支持。只要支持 hooks、MCP 或 REST API 就能接。
已经验证过的包括:Claude Code、Codex CLI、Cursor、Gemini CLI、OpenCode、Cline、Goose、Aider、Claude Desktop、Windsurf、Roo Code、Kilo Code、pi、Hermes、OpenClaw、Qwen Code、Antigravity、Kiro……
一个服务器,所有代理共享记忆。
跟内建记忆比一下
基准测试数据
在内部语料库 coding-agent-life-v1 上:
**Top-5命中率 100%**,精度比grep基线高 2.2倍 延迟:14毫秒
在 ICLR 2025 的 LongMemEval-S(500个问题)上:
R@5: **95.2%**(对比纯BM25回退的86.2%) R@10: 98.6%
Token成本:每年约170K tokens,按现行价格约 $10/年。如果使用本地嵌入(all-MiniLM-L6-v2),成本为0。
对比 mem0(53K星)、Letta(22K星)等同类项目,agentmemory在检索准确率、多代理协调、框架锁定、外部依赖数量上都有明显优势。详细对比表在项目文档里。
怎么装?
全局安装(推荐):
npm install -g @agentmemory/agentmemory
# macOS/Linux 如果遇到权限错误,加 sudo
然后:
agentmemory # 启动服务器
agentmemory demo # 注入示例
agentmemory connect claude-code # 连接你的代理
如果你不想全局安装,用 npx 也行:
npx @agentmemory/agentmemory
从 v0.9.16 开始,首次运行 npx 会内联提示你全局安装,回答 Y 即可。
连接代理的典型配置
以 Cursor / Claude Desktop / Cline 这类使用 mcpServers 结构的代理为例,在配置文件中加入:
"agentmemory": {
"command": "npx",
"args": ["-y", "@agentmemory/mcp"],
"env": {
"AGENTMEMORY_URL": "http://localhost:3111"
}
}
Gemini CLI 用户可以用 gemini mcp add agentmemory npx -y @agentmemory/mcp。
Aider 用户直接调 REST API。
Codex CLI 除了 MCP,还支持完整的插件(6个生命周期hooks + 4个 skills)。
每个代理的具体接入方式,项目文档里都有详尽说明。
额外的好东西
会话回放:在查看器里选择 Replay 标签,可以回放整个会话的提示词、工具调用、工具结果、响应,支持调速和单步。还能导入已有的 Claude Code JSONL 记录。
iii 控制台:端口3114(默认)打开一个更底层的运维界面,能看到每个记忆操作的 OpenTelemetry traces、每个 KV 条目、每个函数的调用负载。甚至可以编辑卡住的整合计时器,重放一个 hook 调用。
扩展能力:agentmemory 本身就是基于 iii 框架构建的。通过 iii worker add 一条命令,就能增加定时任务、持久队列、沙箱执行、多实例同步等能力。
小结
你每次会话的前5分钟都在重新解释技术栈。agentmemory 在后台运行,彻底消除这件事。
捕获工作内容 → 压缩为结构化记忆 → 下次会话自动注入。
让AI代理真正“记住”你的项目,而不是每次从零开始。
项目地址:github.com/rohitg00/agentmemory
文档:agent-memory.dev
安装命令:npm install -g @agentmemory/agentmemory
夜雨聆风