有没有遇到过这种情况:
跟AI写代码,上一个对话告诉它你的项目结构,下一个对话又要解释一遍。上次说好用某个库,这次它又给你推荐别的。每次新开对话,就像重新招了一个实习生,得从头培训。
这不是AI变笨了,是架构问题。大模型本身没有跨会话的记忆,每次对话都是一张白纸。
一个叫claude-mem的开源项目,专门来解决这件事。
它怎么工作的
后台安静运行,不需要你做任何额外操作。
每当你跟Claude写代码,claude-mem在旁边录下发生的一切:你提了什么需求,Claude改了什么文件,遇到了什么问题,用了什么方案。录完之后,它用AI把这些信息压缩成结构化的摘要,存进本地SQLite数据库。
下次你打开新会话,它会检索历史记录,把相关的上下文自动注入进来。Claude就「知道」你之前做过什么了。
这个过程完全透明,你不需要手动复制粘贴任何东西。
现在有多少人在用
2月底上线时拿了30K颗星。到4月初涨到46K。
现在(2026年6月):80,000+ Stars,还在涨。
170位开发者参与贡献,发布了300+个版本。从更新频率来看,这个项目一直在快速迭代,最后代码推送就在4天前。
功能里有哪些值得注意的
Endless Mode(还在Beta阶段):把每次工具调用的输出压缩成约500 token的观察记录,上下文使用量降低约95%,工具调用次数能提升约20倍才耗尽上下文。代价是每次工具调用要多等60到90秒。如果你在做一个需要长时间推进的复杂项目,这个取舍可能值得认真考虑。
mem-search:用自然语言搜索项目历史。比如你想起来几周前好像处理过类似的问题,可以直接问,它会去翻记录告诉你当时是怎么解的。
隐私控制:用 <private> 标签包住的内容不会被存储。所有数据默认只在本地,不上传。
现在支持的不仅仅是Claude Code:项目描述已更新,支持 OpenClaw、Codex、Gemini、Hermes、Copilot、OpenCode 等更多 Agent 工具。
怎么装
npx claude-mem install支持macOS、Linux、Windows。
GitHub:github.com/thedotmack/claude-mem官网:claude-mem.ai
Context window有上限,这是大模型绕不开的物理限制。claude-mem的做法是把记忆管理从模型侧移到工具侧,用压缩和检索代替堆token。
这个方向会有越来越多的人跟进。
技术前哨 | 每天5分钟,知道技术圈在发生什么
夜雨聆风