你是否遇到过这样的崩溃时刻——
上一周刚让AI助手在src/middleware/auth.ts里配好了JWT认证,指定了jose库来实现token验证,这一周再开新会话,它一脸茫然:"啥是JWT?您需要我设置什么认证来着?"
或者,上个session辛辛苦苦调好的API限流逻辑,新会话开始时全部归零,AI对着同样一个问题从头排查、从零开始。
这不是AI的错——是它压根没有"记忆"。
现在,这个问题有解了。
01 它是什么
agentmemory[1]是一个专门为AI编码助手打造的持久化记忆系统,基于iii-engine[2]构建,核心理念一句话:"Your coding agent remembers everything. No more re-explaining."
安装只需一行命令:
npm install -g @agentmemory/agentmemory
agentmemory # 启动记忆服务器
然后把记忆服务接入你的AI助手:
agentmemory connect claude-code # 支持 Claude Code、Codex CLI、Cursor、Gemini CLI、OpenClaw 等
接入后,服务器运行在本地3111端口,实时可视化面板在3113,接入后AI助手会自动记录每次会话的上下文,下次开新会话时自动召回相关记忆——无需你做任何额外操作。
02 核心技术架构
agentmemory的技术选型非常务实,**"零外部依赖"**是最大亮点之一。
| 对比项 | agentmemory | mem0 | Letta/MemGPT |
|---|---|---|---|
| 检索方式 | BM25 + 向量 + 知识图谱(RRF融合) | 向量 + 知识图谱 | 向量(归档型) |
| 外部依赖 | 无(SQLite + 本地嵌入) | Qdrant / pgvector | Postgres + 向量数据库 |
| 自托管 | ✅ 默认支持 | ✅ 可选 | ✅ 可选 |
| 记忆生命周期 | 4层自动归并 + 衰减 + 自动遗忘 | 被动抽取 | Agent自行管理 |
RRF融合(Reciprocal Rank Fusion)是一种将多个排序结果合并的技术——将BM25的关键词精确匹配、向量化检索的语义理解、知识图谱的结构化关系三路信号做加权融合,最终输出的检索结果比单一方法更准、更稳。
具体有多准? 官方在两个基准上测了:
coding-agent-life-v1(自建测试集,15轮真实开发会话):Top-5命中率100%,精确率是grep基线的2.2倍,中位延迟仅14ms。 LongMemEval-S(ICLR 2025公开数据集,500题):R@5达到95.2%,R@10达到98.6%,MRR(平均倒数排名)88.2%。作为对比,BM25单独使用只能拿到86.2% / 94.6% / 71.5%。
这意味着,当你说"帮我修一下那个数据库性能问题"时,agentmemory真的能定位到"上一周的N+1查询优化"那条会话记录,而不是给你一堆无关的模糊匹配。
03 效率账:一年省多少Token?
这里有笔经济账值得算一算。
假设一个重度用户每天跑3个编码会话,每个会话平均500个Token上下文,每年Token消耗量:
| 方案 | 每年Token量 | 每年成本 |
|---|---|---|
| 粘贴全部历史上下文 | 19.5M+ | 不现实(直接爆窗口) |
| LLM自动摘要 | ~650K | ~$500 |
| agentmemory | ~170K | ~0(本地嵌入) |
使用本地嵌入模型(all-MiniLM-L6-v2),成本直接归零。这对于个人开发者和小型团队来说,是真正可以落地的方案。
04 兼容哪些AI助手?
这是agentmemory另一个亮眼的地方——覆盖面极广。
官方支持的AI编码助手列表:
Claude Code(原生插件 + 12个Hook + MCP) Codex CLI(原生插件 + 6个Hook + MCP) GitHub Copilot CLI(MCP + 插件钩子) OpenClaw(原生插件 + MCP)✅ Hermes(原生插件 + MCP) Cursor(MCP服务器) Gemini CLI(MCP服务器) OpenCode(22个Hook + MCP + 插件) Cline、Goose、Kilo Code、Windsurf……
列表还在持续扩充。核心逻辑是:只要你的AI助手支持MCP协议或HTTP API,就能接入agentmemory。多Agent之间共享同一个记忆服务器,互不干扰。
此外,agentmemory还提供了memory_smart_search、memory_save、memory_sessions等53个MCP工具,开箱即用,不需要自己写一行代码。
05 竞品对比:为什么选它
目前市面上做Agent记忆的项目并不少,拿最知名的两个对比:
vs mem0(53K⭐): mem0是面向通用Agent的记忆层API,走云端路线为主,虽然技术成熟度高,但自托管需要额外部署Qdrant或pgvector,学习成本和运维成本都更高。在R@5检索精度上,mem0在LoCoMo测试集上为68.5%,而agentmemory在LongMemEval-S上达到95.2%,差距明显。
vs Letta/MemGPT(22K⭐): Letta走的是"全栈Agent运行时"路线,你需要用Letta的框架重写你的Agent才能用上记忆功能,框架锁定成本很高。agentmemory则完全无锁定,任何MCP客户端即接即用。
06 快速上手
第一步:安装
npm install -g @agentmemory/agentmemory
第二步:启动服务器
agentmemory
# 服务器运行在 http://localhost:3111
# 实时可视化面板在 http://localhost:3113
第三步:接入你的AI助手
agentmemory connect claude-code
# 或
agentmemory connect codex
第四步:体验记忆召回
npx @agentmemory/agentmemory demo
demo会播撒3个模拟会话(JWT认证搭建、N+1查询修复、API限流),然后用语义搜索验证召回效果——你会看到搜"数据库性能优化"能找到"N+1查询修复"这条记录,这就是语义理解的力量。
07 GitHub数据
截至2026年6月1日:
⭐ 18,355 GitHub Stars 全球排名 #2404 本周新增 +355 stars,活跃度持续攀升 36位贡献者 最新版本 v0.9.24
总结
agentmemory解决的是一个非常具体但又极其普遍的问题:AI编码助手没有持久化记忆。
它的优势总结为三句话:
接入极简:一行命令安装,一个命令接入,不改你现有工作流。 技术扎实:BM25+向量+图谱三路融合,R@5达95.2%,实测检索又快又准。 零外部依赖:SQLite加本地嵌入模型,自托管零成本,真正私密可控。
如果你每天重度使用Claude Code、Codex或任何支持MCP的编码助手,装上agentmemory的那一刻,你会发现:原来AI真的可以"记住一切"。
相关链接:
GitHub:https://github.com/rohitg00/agentmemory[3] 官方文档:https://github.com/rohitg00/agentmemory/blob/main/README.md[4] 基准测试报告:https://github.com/rohitg00/agentmemory/blob/main/docs/benchmarks/2026-05-20-coding-agent-life-v1.md[5]
引用链接
[1]agentmemory: https://github.com/rohitg00/agentmemory
[2]iii-engine: https://github.com/iii-hq/iii
[3]https://github.com/rohitg00/agentmemory
[4]https://github.com/rohitg00/agentmemory/blob/main/README.md
[5]https://github.com/rohitg00/agentmemory/blob/main/docs/benchmarks/2026-05-20-coding-agent-life-v1.md
夜雨聆风