一句话定位:基于 iii 引擎的本地持久化记忆服务器,为 18+ 种 AI 编码 Agent(Claude Code、Cursor、Codex CLI 等)提供跨会话、跨 Agent 的共享记忆层,解决"每次新会话都像第一次接手项目"的核心痛点。
一、它是什么?解决什么问题?
2026 年的 AI 编码 Agent 赛道已经拥挤,但它们有一个共同痛点:会话一断,记忆清零。CLAUDE.md、MEMORY.md这类静态文件只有 200 行上限且容易过时,每次新会话都要重新解释项目架构、架构决策和历史踩坑记录——Token 浪费严重,知识无法复用。
AgentMemory 是一个本地运行的记忆服务器。它不是某个特定 Agent 的插件,而是一层独立的基础设施。通过 12 个生命周期钩子自动捕获每次工具调用,压缩为结构化记忆,在下一次会话中按需回灌上下文。一个记忆服务器可以同时服务 Claude Code、Cursor、Gemini CLI、Codex CLI 等 18+ 种主流编程工具。
二、它能做什么?
| 自动记忆捕获 | |
| 四层记忆固化 | |
| 三路混合搜索 | |
| 记忆自动衰减 | |
| Session Replay | |
| 跨 Agent 共享 | |
| 隐私优先 | |
| 团队记忆 |
三、它是如何做到的?
核心是一条记忆管线(Memory Pipeline):
PostToolUse 钩子触发
→ SHA-256 去重(5分钟窗口)
→ 隐私过滤(去除密钥)
→ 存储原始观察(Working)
→ LLM 压缩为结构化事实/概念/叙事
→ 生成向量嵌入(6种提供者 + 本地 all-MiniLM-L6-v2)
→ BM25 + 向量 + 知识图谱三索引
检索时,三路结果通过Reciprocal Rank Fusion(RRF, k=60)融合排序,取 top_k 注入下次会话上下文。
底层基于iii engine(Rust 编写的本地知识引擎),用内置的 HTTP Triggers、KV State、Streams 和 Worker 监管替代了 Express、Postgres/pgvector、SSE、pm2 等传统依赖。零外部数据库服务,SQLite + 内存向量索引完成所有存储。
四层记忆从原始观察到程序性知识逐级压缩衰减:Working(原始,1.0x)→ Episodic(7天,0.4x)→ Semantic(90天,0.15x)→ Procedural(永久,0.05x)。
四、它能用到什么场景?
| 长期项目开发 | |
| 多 Agent 切换 | |
| 团队协作 | |
| 复杂技术栈项目 | |
| 新人 Onboarding |
不适用场景:一次性脚本(overkill)、极简项目(静态文件更轻)、Agent 客户端不支持 MCP hooks(自动捕获效果打折扣)。
五、为什么值得关注?
检索准确率 95.2%:LongMemEval-S 基准测试(ICLR 2025,500 题)R@5 达 95.2%,MRR 0.882。对比纯 BM25 fallback 的 86.2%,混合检索显著提升。 Token 成本大幅降低:官方测算年 Token 消耗约 17 万(对比全量上下文 1950 万+),年成本约 10(本地嵌入则为10(本地嵌入则为0)。月均 Token 下降约 40%。 零外部依赖:SQLite + 本地嵌入 + iii 引擎自包含,无需 PostgreSQL、Redis、向量数据库等外部服务。对私有化部署极其友好。 生态广度突出:53 个 MCP 工具 + 6 个资源 + 3 个提示词 + 4 个技能,是目前最全面的 MCP 记忆工具包。12 种语言 README,社区治理文档齐全。
六、基本信息卡
| 名称 | |
| 类型 | |
| GitHub Stars | |
| 主要语言 | |
| 最新版本 | |
| 官网/GitHub | |
| 核心依赖 | |
| 安装 | npm install -g @agentmemory/agentmemory |
| 环境要求 |
七、竞品分析
| AgentMemory | Mem0 (52k⭐) | MemPalace (43k⭐) | OpenViking (22k⭐) | Letta/MemGPT (22k⭐) | |
|---|---|---|---|---|---|
| 定位 | |||||
| 存储策略 | |||||
| 检索 R@5 | 95.2% | ||||
| 安装成本 | |||||
| Agent 兼容 | |||||
| 核心取舍 |
与竞品相比,AgentMemory 的核心优势是"编码 Agent 专属 + 零外部依赖 + 多 Agent 共享"三合一——Mem0 太通用、MemPalace 存储无边界、OpenViking 部署太重、Letta 绑定运行平台;主要短板是项目尚在 0.9.x 阶段,大规模生产验证不足,且过度依赖 npm/Node 生态,Python 原生支持弱。
夜雨聆风