给AI编码助手装上＂过目不忘＂的能力:agentmemory让Claude记住一切

你是否遇到过这样的崩溃时刻——

上一周刚让AI助手在src/middleware/auth.ts里配好了JWT认证，指定了jose库来实现token验证，这一周再开新会话，它一脸茫然："啥是JWT？您需要我设置什么认证来着？"

或者，上个session辛辛苦苦调好的API限流逻辑，新会话开始时全部归零，AI对着同样一个问题从头排查、从零开始。

这不是AI的错——是它压根没有"记忆"。

现在，这个问题有解了。

01 它是什么

agentmemory^[1]是一个专门为AI编码助手打造的持久化记忆系统，基于iii-engine^[2]构建，核心理念一句话："Your coding agent remembers everything. No more re-explaining."

安装只需一行命令：

npm install -g @agentmemory/agentmemory
agentmemory  # 启动记忆服务器

然后把记忆服务接入你的AI助手：

agentmemory connect claude-code  # 支持 Claude Code、Codex CLI、Cursor、Gemini CLI、OpenClaw 等

接入后，服务器运行在本地3111端口，实时可视化面板在3113，接入后AI助手会自动记录每次会话的上下文，下次开新会话时自动召回相关记忆——无需你做任何额外操作。

02 核心技术架构

agentmemory的技术选型非常务实，**"零外部依赖"**是最大亮点之一。

对比项	agentmemory	mem0	Letta/MemGPT
检索方式	BM25 + 向量 + 知识图谱（RRF融合）	向量 + 知识图谱	向量（归档型）
外部依赖	无（SQLite + 本地嵌入）	Qdrant / pgvector	Postgres + 向量数据库
自托管	✅ 默认支持	✅ 可选	✅ 可选
记忆生命周期	4层自动归并 + 衰减 + 自动遗忘	被动抽取	Agent自行管理

RRF融合（Reciprocal Rank Fusion）是一种将多个排序结果合并的技术——将BM25的关键词精确匹配、向量化检索的语义理解、知识图谱的结构化关系三路信号做加权融合，最终输出的检索结果比单一方法更准、更稳。

具体有多准？ 官方在两个基准上测了：

coding-agent-life-v1（自建测试集，15轮真实开发会话）：Top-5命中率100%，精确率是grep基线的2.2倍，中位延迟仅14ms。
LongMemEval-S（ICLR 2025公开数据集，500题）：R@5达到95.2%，R@10达到98.6%，MRR（平均倒数排名）88.2%。作为对比，BM25单独使用只能拿到86.2% / 94.6% / 71.5%。

这意味着，当你说"帮我修一下那个数据库性能问题"时，agentmemory真的能定位到"上一周的N+1查询优化"那条会话记录，而不是给你一堆无关的模糊匹配。

03 效率账：一年省多少Token？

这里有笔经济账值得算一算。

假设一个重度用户每天跑3个编码会话，每个会话平均500个Token上下文，每年Token消耗量：

方案	每年Token量	每年成本
粘贴全部历史上下文	19.5M+	不现实（直接爆窗口）
LLM自动摘要	~650K	~$500
agentmemory	~170K	~0（本地嵌入）

使用本地嵌入模型（all-MiniLM-L6-v2），成本直接归零。这对于个人开发者和小型团队来说，是真正可以落地的方案。

04 兼容哪些AI助手？

这是agentmemory另一个亮眼的地方——覆盖面极广。

官方支持的AI编码助手列表：

Claude Code（原生插件 + 12个Hook + MCP）
Codex CLI（原生插件 + 6个Hook + MCP）
GitHub Copilot CLI（MCP + 插件钩子）
OpenClaw（原生插件 + MCP）✅
Hermes（原生插件 + MCP）
Cursor（MCP服务器）
Gemini CLI（MCP服务器）
OpenCode（22个Hook + MCP + 插件）
Cline、Goose、Kilo Code、Windsurf……

列表还在持续扩充。核心逻辑是：只要你的AI助手支持MCP协议或HTTP API，就能接入agentmemory。多Agent之间共享同一个记忆服务器，互不干扰。

此外，agentmemory还提供了memory_smart_search、memory_save、memory_sessions等53个MCP工具，开箱即用，不需要自己写一行代码。

05 竞品对比：为什么选它

目前市面上做Agent记忆的项目并不少，拿最知名的两个对比：

vs mem0（53K⭐）： mem0是面向通用Agent的记忆层API，走云端路线为主，虽然技术成熟度高，但自托管需要额外部署Qdrant或pgvector，学习成本和运维成本都更高。在R@5检索精度上，mem0在LoCoMo测试集上为68.5%，而agentmemory在LongMemEval-S上达到95.2%，差距明显。

vs Letta/MemGPT（22K⭐）： Letta走的是"全栈Agent运行时"路线，你需要用Letta的框架重写你的Agent才能用上记忆功能，框架锁定成本很高。agentmemory则完全无锁定，任何MCP客户端即接即用。

06 快速上手

第一步：安装

npm install -g @agentmemory/agentmemory

第二步：启动服务器

agentmemory
# 服务器运行在 http://localhost:3111
# 实时可视化面板在 http://localhost:3113

第三步：接入你的AI助手

agentmemory connect claude-code
# 或
agentmemory connect codex

第四步：体验记忆召回

npx @agentmemory/agentmemory demo

demo会播撒3个模拟会话（JWT认证搭建、N+1查询修复、API限流），然后用语义搜索验证召回效果——你会看到搜"数据库性能优化"能找到"N+1查询修复"这条记录，这就是语义理解的力量。

07 GitHub数据

截至2026年6月1日：

⭐ 18,355 GitHub Stars
全球排名 #2404
本周新增 +355 stars，活跃度持续攀升
36位贡献者
最新版本 v0.9.24

总结

agentmemory解决的是一个非常具体但又极其普遍的问题：AI编码助手没有持久化记忆。

它的优势总结为三句话：

接入极简：一行命令安装，一个命令接入，不改你现有工作流。
技术扎实：BM25+向量+图谱三路融合，R@5达95.2%，实测检索又快又准。
零外部依赖：SQLite加本地嵌入模型，自托管零成本，真正私密可控。

如果你每天重度使用Claude Code、Codex或任何支持MCP的编码助手，装上agentmemory的那一刻，你会发现：原来AI真的可以"记住一切"。

相关链接：

GitHub：https://github.com/rohitg00/agentmemory^[3]
官方文档：https://github.com/rohitg00/agentmemory/blob/main/README.md^[4]
基准测试报告：https://github.com/rohitg00/agentmemory/blob/main/docs/benchmarks/2026-05-20-coding-agent-life-v1.md^[5]

引用链接

[1]agentmemory: https://github.com/rohitg00/agentmemory

[2]iii-engine: https://github.com/iii-hq/iii

[3]https://github.com/rohitg00/agentmemory

[4]https://github.com/rohitg00/agentmemory/blob/main/README.md

[5]https://github.com/rohitg00/agentmemory/blob/main/docs/benchmarks/2026-05-20-coding-agent-life-v1.md