每日一种热门AI工具|agentmemory:让AI编程代理拥有"长期记忆"
Claude Code用着用着上下文窗口不够用了?Cursor聊到一半它突然"失忆"了?OpenCode换了会话后之前解决的bug又出现了?
这不是你的错觉——这是所有AI编程代理的通病:没有记忆。
今天在GitHub上发现了一个猛货,5.9K Stars,今天又涨了1000+。它解决的就是这个问题:让AI编程代理拥有真正的长期记忆。
这个工具是什么
agentmemory 是一个专门为AI编码代理打造的持久化记忆系统。
它的核心思路很清晰:你跟AI聊过的代码、解决的bug、做过的决策,它全都记住。下次换个会话、换个窗口,AI照样知道你是谁、项目是什么、之前卡在哪里。
技术上,它跑在一个本地服务器上(3111端口),通过MCP协议跟各种AI代理连接。不需要任何外部数据库,SQLite都省了——纯内存+本地文件,隐私这块拿捏得很死。
目前支持的代理包括:Claude Code、Codex CLI、Cursor、OpenClaw、Hermes、Gemini CLI、OpenCode、Cline、Windsurf等32+主流AI编程工具。基本上你听过的,它都支持。
它能做什么
1. 自动记住你做过的所有操作
它有12个自动hooks,监听每一次工具调用。你改了哪个文件、跑了什么命令、问了什么问题——全都在它记录范围内。不需要你手动 @tag 或者写什么笔记,AI自己就学会了。
2. 智能检索上下文
你问它"上次那个正则哪里写错了来着",它能秒级召回之前的对话片段。不是简单的关键词匹配,而是 BM25 + 向量检索 + 知识图谱三路融合,R@5准确率 **95.2%**。
对比一下:纯BM25只有86.2%,agentmemory高了近9个百分点。
3. 节省tokens
这是硬账。根据官方数据:
传统方式(每次粘贴完整上下文):每年消耗1900万tokens,费用吓人 LLM摘要方案:每年65万tokens,大概500美元 agentmemory:每年17万tokens,大约10美元
如果用本地嵌入模型(all-MiniLM-L6-v2),一年下来0美元。
4. 团队共享记忆
你一个人的记忆可以共享给团队成员。隔壁工位的同事刚解决了一个刁钻的兼容性问题,你这边直接能搜到他的解决方案——不需要他截图发你再复制进去。
5. 知识图谱
它不只记录事件,还提取实体和关系。你问"这个项目用到了哪些API",它能给你画出一个关系图谱出来。
它有多强
上数据。agentmemory 在 LongMemEval-S 基准测试(ICLR 2025,500道题)上的表现:
| agentmemory | 95.2% | 98.6% | 88.2% |
对比市面上的竞品:
| 95.2% | |||
| 0 | |||
| ≈$10 |
官方还秀了一波:827个测试用例全部通过,0外部数据库依赖。Apache-2.0开源协议。
国内能不能用
能,而且用起来很舒服。
最大的原因:它支持本地嵌入模型,不需要调用任何境外API。
具体来说:
# 环境变量这样设EMBEDDING_PROVIDER=local# 它会自动用 all-MiniLM-L6-v2 模型,完全离线这样一来:
数据不出你的电脑 不需要科学上网 不需要API Key 完全免费
如果你用的是国产大模型,它也支持:
# 智谱GLMMINIMAX_API_KEY=你的key# 或者OpenRouter(可挂国内支付)OPENROUTER_API_KEY=你的keyOpenRouter比较有意思,它支持很多模型,包括一些国产模型,用它做中转可以统一管理。百炼兼容的话,目前没直接测试,但REST API是通用的,自己搭个代理应该能通。
怎么用
第一步:安装(30秒搞定)
# 方式一:直接用npx跑(最简单)npx @agentmemory/agentmemory# 方式二:从源码编译git clone https://github.com/rohitg00/agentmemory.gitcd agentmemorynpm install && npm run buildnpm start服务器启动后会跑在 localhost:3111,同时还有一个Web界面在 localhost:3113,可以实时查看记忆状态。
第二步:让你的AI代理连接它
不同的代理配置方式略有不同,我分别说:
Claude Code:
安装命令:在Claude Code里运行/plugin marketplace add rohitg00/agentmemory/plugin install agentmemoryCursor:在 ~/.cursor/mcp.json 里加:
{"mcpServers": {"agentmemory": {"command": "npx","args": ["-y", "@agentmemory/mcp"],"env": {"AGENTMEMORY_URL": "http://localhost:3111" } } }}OpenCode:在项目根目录创建 opencode.json:
{"mcpServers": {"agentmemory": {"command": "npx","args": ["-y", "@agentmemory/mcp"] } }}Cline / Roo Code / Kilo Code:在MCP设置UI里添加服务器,填入:
npx -y @agentmemory/mcp第三步:开始用它
装好后,你就有了一组新的命令:
/recall <关键词> | |
/remember <内容> | |
/session-history | |
/forget <记忆名> |
比如你在解决一个难缠的CSS兼容性问题:
你:/remember 修复了移动端Safari的flex布局bug,解决方案是给父元素加min-height:0下次遇到类似问题:
你:/recall flex布局移动端-> 找到了:2026-05-13 修复了移动端Safari的flex布局bug...第四步:进阶玩法
如果你想用更强的搜索能力,可以配置向量嵌入:
# 安装本地嵌入(推荐,完全免费)# agentmemory默认就带,你只需要确保npm包安装好了# 如果你想用云端(可选)GEMINI_API_KEY=你的key# 或者OPENAI_API_KEY=你的keyOPENAI_EMBEDDING_MODEL=text-embedding-3-small想看知识图谱?打开 localhost:3113 的Web界面,记忆、关系图谱、会话历史全在上面,很直观。
适合谁
强烈推荐:
长期做复杂项目的开发者(AI编程代理的"失忆症"真的是痛) 需要在多个AI工具间切换的人(Claude Code写代码、Cursor改UI、OpenCode做review) 团队协作场景(知识沉淀不用靠口口相传)
可以试试:
偶尔用AI辅助编程的个人开发者 对数据隐私有要求、不想让代码上传到第三方的人
不太适合:
只是简单问个问题就走人的轻度用户 习惯了每次新建会话重头再来的"硬核"用户
个人看法
用了两天下来,最大的感受是:终于有人认真在解决"AI编程代理记不住"这个问题了。
之前大家的解法要么是手动总结、要么是靠LLM做摘要,操作成本高,而且效果不稳定。agentmemory直接把这个问题做成了一个完整的系统——12个hooks自动捕获、三路检索融合、知识图谱、团队共享,全都给你包圆了。
技术上,它基于 iii engine 这个框架重构了整个后端,不依赖传统的Express+Postgres那套东西,听起来挺激进的,但827个测试全过说明基本功还是扎实的。
当然,坑也有:
配置还是有点繁琐。32+代理的支持靠的是各种配置文件,对新手来说,找到自己用的代理对应的配置方式需要点耐心。
知识图谱默认关闭。需要设
GRAPH_EXTRACTION_ENABLED=true才能用,有点隐藏。MCP工具太多(51个),学完一遍要花时间。
不过说实话,**$0成本、95.2%准确率、零外部依赖** 这三个放在一起,同价位真的没有对手。mem0和Letta我都试过,要么要搭向量数据库,要么准度没这么高,要么贵。agentmemory在这个细分场景里,目前是体验最完整的。
如果你也在被AI编程代理的"金鱼记忆"折磨,强烈建议试试。
评论区聊聊:
你在用哪个AI编程代理?有没有遇到过"聊到一半它忘了"的情况?当时是怎么解决的?有没有什么土方法比工具还好使?
我先说:我之前的土办法是把关键对话复制到Notion里,需要的时候Ctrl+F。说出来都是泪。
夜雨聆风