给你的 AI 编程助手装上＂长期记忆＂-夜雨聆风

给你的 AI 编程助手装上＂长期记忆＂

AI 编程 · 开源工具 · 深度解析

给你的 AI 编程助手装上”长期记忆”

Claude-Mem 深度解析：一个 4 万+ Star 的开源插件如何解决 AI 编程最大的痛点

“我们这个项目用的是 FastAPI 框架，数据库选的 PostgreSQL，ORM 用的是 SQLAlchemy，之前说过不要用 Django……”

——你本周第四次在新会话里重复这段话

如果你是 Claude Code 的用户，这个场景一定不陌生。

每次打开一个新的 Claude Code 会话，AI 就像被按下了重启键。上一秒它还和你热火朝天地讨论架构设计，下一秒就忘了你们昨天讨论了什么。你不得不从头把项目背景、技术栈偏好、之前的设计决策一一重新交代。

这种体验，很像带了一个能力极强但每天都失忆的实习生。

这个痛点并不只属于少数人。在开发者社区里，关于 AI 编码助手”跨会话失忆”的抱怨比比皆是——有人说每天早上要花 20 分钟重新解释项目架构，有人说每次开新会话都像在培训新员工。

然后，一个叫 Claude-Mem 的开源项目出现了。

Claude-Mem 是什么

Claude-Mem 是由独立开发者 Alex Newman（GitHub: @thedotmack）开发的一个 Claude Code 插件。

用一句话概括：它为 Claude Code 装上了一颗”长期记忆大脑”。

具体来说，它做了三件事：

STEP 01

自动记录

编码会话中 Claude 执行的每一个工具操作、做出的每一个技术决策、修复的每一个 Bug，都会被自动捕获为”观察记录”。

STEP 02

智能压缩

后台 Worker 服务通过 Claude Agent SDK 处理原始记录，提取关键”学习要点”，生成语义摘要。压缩率约 53%，大幅降低 Token 消耗。

STEP 03

自动注入

开启新会话时，相关历史摘要自动注入上下文。对 Claude 来说，它”感觉”自己一直记得——虽然记忆是被悄悄塞回去的。

4.1 万+

GitHub Star

3,100+

Fork

GitHub Trending

两行命令，即装即用

Claude-Mem 的安装过程简单得让人意外。在 Claude Code 终端中输入两行命令即可：

> /plugin marketplace add thedotmack/claude-mem

> /plugin install claude-mem

重启 Claude Code，插件就开始工作了。不需要额外配置，不需要手动管理——它在后台默默完成记录、压缩、注入的全流程。

如果你想深度定制，所有设置都在 ~/.claude-mem/settings.json 中管理。它还内置了一个 Web 查看器界面（默认地址 localhost:37777），可以实时查看记忆流、管理配置。

技术架构：五个生命周期钩子

Claude-Mem 的技术实现围绕五个生命周期钩子展开，它们在用户使用 Claude Code 的不同阶段被触发：

SessionStart · 会话开始

从数据库中读取最近的观察记录摘要，注入到新会话上下文中，让 Claude 从一开始就”记得”之前的工作。

UserPromptSubmit · 用户提交提示

捕获用户的输入信息，为后续的观察记录提供上下文。

PostToolUse · 工具执行后

核心钩子。每当 Claude 执行一个工具操作（读写文件、运行命令等），都会捕获操作详情，包括工具名称、输入参数和输出结果。

Summary · 摘要生成

Worker 服务在后台异步处理观察记录，通过 Claude Agent SDK 提取关键信息，生成压缩后的语义摘要。

SessionEnd · 会话结束

生成整个会话的总结摘要，为下一次对话做好准备。

🔄 数据流概览

输入 Claude Code 向 Hook 发送工具执行数据↓存储 Hook 将观测结果写入 SQLite 数据库↓处理 Worker 通过 Agent SDK 压缩提炼↓输出压缩摘要写回数据库↓检索下一会话自动读取摘要并注入上下文

三层渐进式记忆检索

Claude-Mem 在记忆检索上采用了一种模拟人类记忆的分层策略，这也是它在 Token 效率上的核心亮点：

LAYER 1

🧠 索引层

会话开始时只展示存在哪些观察记录及其 Token 成本。就像”我知道我知道这件事”——不展开细节，开销极小。

LAYER 2

🔍 细节层

当 Claude 需要特定信息时，通过 MCP 搜索工具按需获取完整的观察记录叙述。只在需要时才加载详情。

LAYER 3

💎 完美回忆层

在极少数需要精确溯源的场景下，可以访问源代码和原始记录。全量数据，完整还原。

💡 这种设计相比传统”一次性加载全部上下文”的方式，每个会话启动时大约能节省 2,250 个 Token。实际使用中只需用自然语言提问，系统会自动检索返回。

隐私控制：你的数据你做主

作为一个记录所有编码活动的工具，Claude-Mem 对隐私问题给出了明确的回答。

它采用了双标签隐私系统：用 <private> 标签包裹的内容（如 API 密钥、数据库密码等）永远不会进入数据库。系统级标签则防止观察记录的递归存储。

所有数据都存储在本地 SQLite 数据库中，不上传任何云端服务器。你的代码逻辑、技术决策、项目架构——都留在你自己的机器上。

不只是代码：法律学习模式

Claude-Mem 并没有把自己局限在编程领域。它在最近的版本中新增了 law-study 模式，专为法学生设计。

在这个模式下，系统会自动标记考试相关知识点、少数观点、容易出错的法律概念，帮助法学生在与 Claude 的对话中积累结构化的法律知识。还有一个”Chill”变体，只记录高信号信息——问题模式、常见陷阱和教授的分析框架。

这展示了 Claude-Mem 框架的通用性：任何需要跨会话知识连续性的场景，都有可能从中受益。

为什么它能爆火

Claude-Mem 的爆火并非偶然。它踩中了 AI 编码助手发展中一个真正的结构性痛点。

2026 年初，AI 编码工具已经从”能不能写代码”进化到了”能不能高效协作”。Claude Code 的能力已经足够强大，但每次会话都要重新建立上下文的问题，严重制约了深度使用的效率。

Claude-Mem 提供了一个优雅的解决方案——它不需要修改 Claude Code 本身，不依赖官方特殊接口，而是通过插件系统和生命周期钩子机制，在现有架构上“长”出了记忆能力。

另一个关键因素：作为第三方开源项目，它比官方工具迭代更快、更灵活。你可以自行管理存储位置、手动编辑记忆文件、选择不同的 AI 模型来处理观察记录。这种灵活性是官方集成方案通常难以提供的。

快速上手指南

Step 1 · 安装插件

在 Claude Code 终端中执行两行安装命令（见上文）。

Step 2 · 重启 Claude Code

关闭并重新打开 Claude Code。插件自动开始工作，无需额外操作。

Step 3 · 正常使用

像往常一样编码。当你开启新会话时，之前的上下文自动出现。想搜索过去的记录？直接问 Claude：“上次我们怎么修复那个认证 Bug 的？”

可选 · Web 查看器

浏览器访问 localhost:37777 查看所有观察记录、会话摘要和系统状态。

AI 编程工具的竞争已经从”谁更聪明”转向了”谁更懂得记住”

一个没有记忆的 AI 助手，只是高级的一次性工具一个拥有持久记忆的 AI 助手，才是真正的开发伙伴

如果你也受够了每次开新会话都要重新解释项目背景的日子不妨试试 Claude-Mem两行命令的安装成本换来的可能是开发效率的质变

📦 项目地址

github.com/thedotmack/claude-mem

📖 官方文档

docs.claude-mem.ai

🖥️ Web 查看器

安装后访问 localhost:37777

ColaAI

关注 AI 前沿，拆解技术趋势一杯可乐的时间，读懂 AI 世界的变化

本文基于 claude-mem 项目的公开文档和社区报道整理