每日一种热门AI工具|agentmemory:让AI编程代理拥有＂长期记忆＂

每日一种热门AI工具｜agentmemory：让AI编程代理拥有"长期记忆"

Claude Code用着用着上下文窗口不够用了？Cursor聊到一半它突然"失忆"了？OpenCode换了会话后之前解决的bug又出现了？

这不是你的错觉——这是所有AI编程代理的通病：没有记忆。

今天在GitHub上发现了一个猛货，5.9K Stars，今天又涨了1000+。它解决的就是这个问题：让AI编程代理拥有真正的长期记忆。

这个工具是什么

agentmemory 是一个专门为AI编码代理打造的持久化记忆系统。

它的核心思路很清晰：你跟AI聊过的代码、解决的bug、做过的决策，它全都记住。下次换个会话、换个窗口，AI照样知道你是谁、项目是什么、之前卡在哪里。

技术上，它跑在一个本地服务器上（3111端口），通过MCP协议跟各种AI代理连接。不需要任何外部数据库，SQLite都省了——纯内存+本地文件，隐私这块拿捏得很死。

目前支持的代理包括：Claude Code、Codex CLI、Cursor、OpenClaw、Hermes、Gemini CLI、OpenCode、Cline、Windsurf等32+主流AI编程工具。基本上你听过的，它都支持。

它能做什么

1. 自动记住你做过的所有操作

它有12个自动hooks，监听每一次工具调用。你改了哪个文件、跑了什么命令、问了什么问题——全都在它记录范围内。不需要你手动 @tag 或者写什么笔记，AI自己就学会了。

2. 智能检索上下文

你问它"上次那个正则哪里写错了来着"，它能秒级召回之前的对话片段。不是简单的关键词匹配，而是 BM25 + 向量检索 + 知识图谱三路融合，R@5准确率 **95.2%**。

对比一下：纯BM25只有86.2%，agentmemory高了近9个百分点。

3. 节省tokens

这是硬账。根据官方数据：

传统方式（每次粘贴完整上下文）：每年消耗1900万tokens，费用吓人
LLM摘要方案：每年65万tokens，大概500美元
agentmemory：每年17万tokens，大约10美元

如果用本地嵌入模型（all-MiniLM-L6-v2），一年下来0美元。

4. 团队共享记忆

你一个人的记忆可以共享给团队成员。隔壁工位的同事刚解决了一个刁钻的兼容性问题，你这边直接能搜到他的解决方案——不需要他截图发你再复制进去。

5. 知识图谱

它不只记录事件，还提取实体和关系。你问"这个项目用到了哪些API"，它能给你画出一个关系图谱出来。

它有多强

上数据。agentmemory 在 LongMemEval-S 基准测试（ICLR 2025，500道题）上的表现：

系统	R@5准确率	R@10准确率	MRR
agentmemory	95.2%	98.6%	88.2%
BM25-only	86.2%	94.6%	71.5%

对比市面上的竞品：

特性	agentmemory	mem0 (53K Stars)	Letta (22K Stars)
R@5准确率	95.2%	68.5%	83.2%
自动捕获	✅ 12个hooks	❌ 手动add()	❌ Agent自编辑
外部依赖	0	需要Qdrant/pgvector	需要Postgres+向量库
年成本	≈$10	变动	context内嵌

官方还秀了一波：827个测试用例全部通过，0外部数据库依赖。Apache-2.0开源协议。

国内能不能用

能，而且用起来很舒服。

最大的原因：它支持本地嵌入模型，不需要调用任何境外API。

具体来说：

# 环境变量这样设EMBEDDING_PROVIDER=local# 它会自动用 all-MiniLM-L6-v2 模型，完全离线

这样一来：

数据不出你的电脑
不需要科学上网
不需要API Key
完全免费

如果你用的是国产大模型，它也支持：

# 智谱GLMMINIMAX_API_KEY=你的key# 或者OpenRouter（可挂国内支付）OPENROUTER_API_KEY=你的key

OpenRouter比较有意思，它支持很多模型，包括一些国产模型，用它做中转可以统一管理。百炼兼容的话，目前没直接测试，但REST API是通用的，自己搭个代理应该能通。

怎么用

第一步：安装（30秒搞定）

# 方式一：直接用npx跑（最简单）npx @agentmemory/agentmemory# 方式二：从源码编译git clone https://github.com/rohitg00/agentmemory.gitcd agentmemorynpm install && npm run buildnpm start

服务器启动后会跑在 localhost:3111，同时还有一个Web界面在 localhost:3113，可以实时查看记忆状态。

第二步：让你的AI代理连接它

不同的代理配置方式略有不同，我分别说：

Claude Code：

安装命令：在Claude Code里运行/plugin marketplace add rohitg00/agentmemory/plugin install agentmemory

Cursor：在 ~/.cursor/mcp.json 里加：

{"mcpServers": {"agentmemory": {"command": "npx","args": ["-y", "@agentmemory/mcp"],"env": {"AGENTMEMORY_URL": "http://localhost:3111"      }    }  }}

OpenCode：在项目根目录创建 opencode.json：

{"mcpServers": {"agentmemory": {"command": "npx","args": ["-y", "@agentmemory/mcp"]    }  }}

Cline / Roo Code / Kilo Code：在MCP设置UI里添加服务器，填入：

npx -y @agentmemory/mcp

第三步：开始用它

装好后，你就有了一组新的命令：

命令	作用
`/recall <关键词>`	搜索记忆
`/remember <内容>`	保存到长期记忆
`/session-history`	查看最近会话
`/forget <记忆名>`	删除某条记忆

比如你在解决一个难缠的CSS兼容性问题：

你：/remember 修复了移动端Safari的flex布局bug，解决方案是给父元素加min-height:0

下次遇到类似问题：

你：/recall flex布局移动端-> 找到了：2026-05-13 修复了移动端Safari的flex布局bug...

第四步：进阶玩法

如果你想用更强的搜索能力，可以配置向量嵌入：

# 安装本地嵌入（推荐，完全免费）# agentmemory默认就带，你只需要确保npm包安装好了# 如果你想用云端（可选）GEMINI_API_KEY=你的key# 或者OPENAI_API_KEY=你的keyOPENAI_EMBEDDING_MODEL=text-embedding-3-small

想看知识图谱？打开 localhost:3113 的Web界面，记忆、关系图谱、会话历史全在上面，很直观。

适合谁

强烈推荐：

长期做复杂项目的开发者（AI编程代理的"失忆症"真的是痛）
需要在多个AI工具间切换的人（Claude Code写代码、Cursor改UI、OpenCode做review）
团队协作场景（知识沉淀不用靠口口相传）

可以试试：

偶尔用AI辅助编程的个人开发者
对数据隐私有要求、不想让代码上传到第三方的人

不太适合：

只是简单问个问题就走人的轻度用户
习惯了每次新建会话重头再来的"硬核"用户

个人看法

用了两天下来，最大的感受是：终于有人认真在解决"AI编程代理记不住"这个问题了。

之前大家的解法要么是手动总结、要么是靠LLM做摘要，操作成本高，而且效果不稳定。agentmemory直接把这个问题做成了一个完整的系统——12个hooks自动捕获、三路检索融合、知识图谱、团队共享，全都给你包圆了。

技术上，它基于 iii engine 这个框架重构了整个后端，不依赖传统的Express+Postgres那套东西，听起来挺激进的，但827个测试全过说明基本功还是扎实的。

当然，坑也有：

配置还是有点繁琐。32+代理的支持靠的是各种配置文件，对新手来说，找到自己用的代理对应的配置方式需要点耐心。
知识图谱默认关闭。需要设 GRAPH_EXTRACTION_ENABLED=true 才能用，有点隐藏。
MCP工具太多（51个），学完一遍要花时间。

不过说实话，**$0成本、95.2%准确率、零外部依赖** 这三个放在一起，同价位真的没有对手。mem0和Letta我都试过，要么要搭向量数据库，要么准度没这么高，要么贵。agentmemory在这个细分场景里，目前是体验最完整的。

如果你也在被AI编程代理的"金鱼记忆"折磨，强烈建议试试。

评论区聊聊：

你在用哪个AI编程代理？有没有遇到过"聊到一半它忘了"的情况？当时是怎么解决的？有没有什么土方法比工具还好使？

我先说：我之前的土办法是把关键对话复制到Notion里，需要的时候Ctrl+F。说出来都是泪。