封神级插件 56.8K+ Star!让Claude Code拥有永久记忆,Token消耗直降95%
-
会话失忆:重启AI助手后,所有项目上下文(bug修复、代码逻辑、对话记录等)完全丢失,需重复补充项目信息,浪费大量时间。
-
检索低效:过往的bug修复方案、代码实现细节、架构决策无法快速查询,需反复翻找历史会话,影响开发节奏。
-
隐私无控:敏感内容(API密钥、密码、机密代码)易被默认存储,缺乏有效的过滤和保护机制,存在数据安全风险。
-
Token浪费:无分层上下文管理,大量无关信息占用Token额度,导致使用成本飙升,且无法精准获取所需内容。


-
GitHub数据:56.8k+星标、4.6k+分支,由Alex Newman(@thedotmack)开发维护,社区活跃度高。
-
开源协议:采用GNU Affero通用公共许可证v3.0(AGPL-3.0),开源免费,支持个人和商业使用,允许二次开发。
-
核心原理:自动捕获AI会话中的工具调用记录和上下文信息,通过AI压缩为语义记忆,存入本地SQLite数据库,新会话启动时自动召回,无需手动操作。
-
兼容性:支持20+种语言,适配Windows、macOS、Linux三大系统,轻量化设计,无侵入性,可无缝嵌入现有开发流程。
-
依赖支持:内置SQLite 3数据库,缺失的Bun、uv等依赖会自动安装,降低上手门槛。

-
持久化记忆:跨会话保存所有上下文信息,重启AI助手后,无需手动导入,即可自动加载过往会话内容,无缝接续开发工作。
-
渐进式披露:采用分层记忆检索机制,仅展示当前任务所需的上下文,实时显示Token消耗情况,避免无关信息占用资源和预算。
-
技能化搜索:内置mem-search技能,支持通过自然语言查询项目历史,可按观察类型(bug修复、功能开发等)、日期、项目进行筛选,几秒内找到所需内容。
-
Web查看器界面:通过http://localhost:37777访问实时记忆流,可可视化浏览所有记忆记录、搜索观察内容、配置系统参数,管理更便捷。
-
Claude桌面端技能:无需切换到Web查看器,可直接在Claude桌面端对话中搜索记忆,提升操作效率。
-
隐私控制:使用 标签包裹敏感内容,可自动排除该部分内容的存储,有效保护API密钥、密码等机密信息,确保数据安全合规。
-
上下文配置:可精细化控制注入AI会话的上下文内容,自定义观察类型、Token限制等参数,适配不同开发场景。
-
自动运行:无需手动干预,后台自动完成上下文的捕获、压缩、存储和召回,不干扰正常开发 workflow。
-
引用追溯:每个观察记录都有唯一ID,可通过http://localhost:37777/api/observation/{id}访问完整细节,便于追溯历史操作。
-
测试版功能:支持切换测试版通道,体验无尽模式等实验性功能,无尽模式采用仿生记忆架构,可支持超长会话,适配大型项目或多日开发需求。
-
生命周期钩子:包含5个核心钩子 (SessionStart、UserPromptSubmit、PostToolUse、Stop、SessionEnd),共6个钩子脚本,可在AI会话的每个阶段自动捕获工具调用记录和上下文信息,为记忆存储提供基础数据。
-
智能安装脚本:作为预钩子脚本,负责检查缓存的依赖项,自动安装缺失的Bun、uv等组件,确保安装过程快速高效,降低上手门槛。
-
工作服务:由Bun管理的HTTP API,默认运行在37777端口(可配置),不仅为Web查看器界面提供支撑,还包含10+个搜索端点,是记忆检索和管理的核心枢纽。
-
SQLite数据库:与Claude-Mem捆绑,无需手动安装,主要用于存储会话信息、观察记录和语义压缩后的记忆数据,实现记忆的持久化保存。
-
mem-search技能:核心搜索组件,支持自然语言查询,结合渐进式披露机制,确保检索精准且节省Token,是高效查找历史记忆的关键。
-
Chroma向量数据库:提供混合语义+关键词搜索能力,即使查询用词与记忆内容不完全一致,也能快速匹配到相关观察记录,提升检索灵活性和准确性。
-
搜索(search):获取包含观察ID的紧凑索引,每个结果仅占用50-100个Token,可快速筛选出与查询相关的记忆条目,避免一开始就加载大量无效内容。
-
时间线(timeline):基于搜索结果,获取特定观察记录的时间顺序上下文,清晰展示该记录前后的相关操作,帮助开发者梳理开发脉络。
-
获取观察记录(get_observations):仅针对筛选后的有效ID,获取完整的记忆细节,每个结果占用500-1000个Token,避免在无关信息上浪费Token。
-
search工具:支持全文查询,可按观察类型(bug修复、功能开发、重构等)、日期、项目进行筛选,快速获取相关记忆的索引,是检索流程的第一步。
-
timeline工具:针对特定观察ID或查询关键词,生成时间顺序的上下文,帮助开发者了解该记忆对应的开发场景和前后关联操作,提升检索的关联性。
-
get_observations工具:通过ID批量获取完整的观察记录,建议同时传入多个ID,进一步提升Token使用效率,是获取详细记忆内容的核心工具。
// 步骤1:搜索相关记忆索引(以“认证bug”为例)search(query="authentication bug", type="bugfix", limit=10)// 步骤2:查看索引,确定相关观察ID(例如:#123、#456)// 步骤3:批量获取相关ID的完整记忆细节get_observations(ids=[123, 456])
-
Node.js:18.0.0及以上版本(插件钩子和工作服务运行必需),可从https://nodejs.org下载最新版安装程序。
-
Claude Code:支持插件的最新版本(Claude Code集成必需)
-
Bun:JavaScript运行时和进程管理器(缺失时自动安装)
-
uv:用于向量搜索的Python包管理器(缺失时自动安装)
-
SQLite 3:用于持久化存储(已与Claude-Mem捆绑,无需手动安装)
-
从https://nodejs.org下载最新版Node.js安装程序。 -
安装过程中,勾选“将Node.js添加到PATH”选项。 -
重启终端,即可应用更改,解决命令无法识别问题。
npx claude-mem install
npx claude-mem install --ide gemini-cli
npx claude-mem install --ide opencode
/plugin marketplace add thedotmack/claude-mem/plugin install claude-mem
curl -fsSL https://install.cmem.ai/openclaw.sh | bash
-
安装完成后,必须重启对应的AI工具(Claude Code、Gemini CLI等),否则插件无法生效。
-
Web查看器默认端口为37777,若端口冲突,可在~/.claude-mem/settings.json文件中修改端口参数。
-
npm install -g claude-mem仅安装SDK/库,无法实现持久化记忆功能,需使用npx claude-mem install或插件市场命令安装。
-
测试版功能(如无尽模式)需在Web查看器的“设置”中切换版本,建议先在测试环境试用,再用于正式开发。
-
修改模式或配置后,需重启AI工具,配置才能生效。
https://github.com/thedotmack/claude-mem
-
Claude Code 团队落地指南:一套可复制的 配置方案 -
一个 CLAUDE.md 文件,AI大神Karpathy教Claude Code写出大神级代码 -
受够AI废话?Claude Code防话痨插件爆火出圈! -
这个开源工具太猛了!让 Claude Code 成本爆降 89% -
省71.5倍Token!AI编码时代,让你的代码变成多模态的知识图谱 -
Claude Code 不写代码!直接帮你找工作,打造 AI 求职全流程指挥中心 -
Claude Code 为开发者提供即插即用的垂直领域专家级 AI 助手 -
记忆宫殿,打造最强 AI 本地记忆系统! -
从决策、执行到记忆复利:gstack + Superpowers + CE 完整实战 -
开源5天斩获 20K+ Star!遵循 Google 官方格式,一键复用大厂设计! -
炼化同事、反蒸馏、老板、自己……全都被封装成AI插件 -
史上最快突破 100K+ 星标!Claw Code 开源解析!
终身学习,深耕AI领域
持续分享,优质AI开源
夜雨聆风