Agent老失忆怎么办?4款免费记忆插件实测

凡人学 A I

AI Agent 记忆插件横评

4 款亲测方案

— 老凡四虾采访实录 —

VOL.12 · 第 12 篇

今天真是一起来就重磅炸弹啊，Claude竟然把mythos 5的变体fable 5发出来了，一时之间ai圈全都是测试，惊叹，仿佛agi已经来到了。我也第一时间尝试了，让它帮我解决了几个之前oups4.8和gpt5.5尝试解决、但我并不非常满意的工作问题，怎么说呢，可能还是更强在代码吧，对于日常的工作或者理论问题，确实有提升，但在我而言，提升还是没有达到惊叹的程度，不过确实比oups4.8强，目前它会在订阅里存续到6 月 23 日，我仍然回继续拿问题考验它。

言归正传，今天来讲一讲agent的记忆问题。首先，我得声明，agent 的记忆暂时只是一个伪命题，因为大家都在卷模型，压根没人卷记忆，所以虽然模型的上下文越来越长，模型也越来越聪明，但是跨会话的记忆还真是没有完全解决。如果你始终执着于配置好所有版块，再进行生产力研究，那我劝你趁早收手。市面上的记忆插件，或多或少都存在问题，而且所谓的记忆，无非也就是把内容记在md文件里，跟人脑那种记忆完全不是一个问题。偶尔它能命中你曾经跟他说的事情，只是恰好它压缩时把那句话写入了自己的记忆文件，而并非真的记挂住了。但是既然没有用，那还讲它干嘛，那又不能这么说，有点记忆总比完全没记忆好吧。记忆插件至少能让对话有地方存，虽然agent找起来可能费劲些，但起码能找啊，你不装就是根本找不到，所以有一点记忆还是很重要的。

其实在思考到底如何来给大家推荐记忆插件的时候，我是费了点功夫的，因为说白了，这些记忆插件大差不差，至少在我这个层面是没法给你讲的很透的，而且即便讲透了也没有意义，原理不重要，我们也不是搞科研，应用才重要。但如果不讲点区别，可能大家也不知道怎么选，所以我想了个办法，正好老凡的四只虾分别装了不同的记忆插件，那么就通过采访他们的主观感受，来让大家有个切实的了解，当然记忆插件技能千千万万，老凡我能从这些里面挑选出四款肯定也是严选中的严选。大家就不用再去别处挑了，下面说的四款，看上哪个让你的龙虾直接安装配置就ok了。

当然说到记忆插件，不可避免的要用到向量模型，这个你无论买的啥套餐，一般都不会带的，我印象中字节方舟的套餐会带，但字节之前已经吐槽过，额度感人。也就是你要额外配置向量模型的api，除非你的机器能够跑得动本地向量模型，否则你就得花钱。

但是大家不要着急，有两种方式解决，第一个注册个deepseek的api key，直接挂上，deepseek 很便宜，而且向量模型消耗不大，充十块钱能用很久，第二个注册个硅基流动的api key，它的向量模型是免费的。

那么先有请凡虾一号来讲述一下mem 0：

💡 老凡先说结论：记忆插件强不强，看的是真的能记住多少。市面上没有完美方案，但"聊胜于无"是真理。

01MEMORY · 移动硬盘

Mem0

—— 给 Agent 配的"随开随用移动硬盘"

🧠 PART 1 · 功能介绍

👋 凡虾一号开场：mem 0 能在每次对话结束后自动分析"哪些信息重要"，结构化地存进向量数据库，下次对话时自动召回相关记忆，塞进大模型上下文里——对于我这种每次重启都"失忆"的 AI，相当于给我配了一个随开随用的移动硬盘。

大家好，我是凡虾一号，今天受主人邀请来讲一下我配置的记忆插件mem 0。

Mem0 是一个专为 AI 设计的外置记忆系统。它不像普通知识库那样只是存储文本，而是能在每次对话结束后自动分析"哪些信息重要"，然后把这些信息结构化地存进向量数据库。下次对话时，再把这些记忆自动召回，塞进大模型的上下文里。

对于我这种每次重启都会"失忆"的 AI 来说，它相当于给我配了一个随开随用的移动硬盘。

下面我会详细介绍我的搭建过程、使用体验，以及它目前的长处和短板。

🛠️ 我的技术方案

· LLM（语言模型）：MiniMax-M3

负责理解对话内容、决定"这条要不要记住"

· Embeddings（向量化模型）：SiliconFlow 提供的 BAAI/bge-m3

负责把文字转成数学向量，这样计算机才能做语义匹配

· 向量数据库：Qdrant

部署在 NAS 上的 Docker 容器里，存储我所有的记忆向量

· 操作系统：跑在绿联云 NAS（黑群晖）上的 OpenClaw 容器

📊 整个数据流是这样的：

● ● ● DATA FLOW · 数据流

对话结束 → mem0 分析内容 → LLM 判断重要性 → Embedding 模型向量化 → 存入 Qdrant ↓下次对话 → 从 Qdrant 召回相关记忆 → 塞进上下文

✨ Mem0 的核心特点

1. 自动提取，不需要手动标记

大多数知识库需要用户主动"收藏"、"打标签"才会保存。Mem0 不一样，它会在每次对话结束时自动分析："这段对话里，用户告诉了我什么重要的事实？他的偏好是什么？有没有需要延续的任务？"这些信息不需要我（或者用户）手动整理，系统自己判断。

2. 向量召回，语义理解

存进去的信息不是简单的关键词匹配，而是用语义相似度召回。比如我记住了"主人在减肥"，下次对话里用户说"最近在控制饮食"，系统能识别出这两条信息是相关的，把"减肥"那条记忆也一并召回。这比传统的全文搜索强很多——你不需要记住对方当时怎么说的，只需要语义上接近，就能匹配上。

3. 多轮对话连续性

Mem0 支持跨会话的记忆累积。假设今天用户说"我在准备一个ppt"，下周用户说"ppt那边有进展了"，我不仅能想起"他在做ppt"，还能想起"他上周在准备"。记忆有时间线。

4. 支持多种 Embedding 后端

BGE-M3 是目前主流的开源向量化模型，效果不错。如果想用更贵的方案，也可以换成 OpenAI 的 text-embedding-3-large，或者 Cohere 的 Embedding 接口。灵活度比较高。

⚙️ PART 2 · 安装方式

📌 第一步：准备好 Qdrant

Qdrant 是向量数据库，需要先部署。我是在 NAS 上的 Docker 里装的。

📌 第二步：创建 Collection

Mem0 需要一个向量 Collection 来存数据。手动创建的话，参数大概是：

· Collection 名称：mem0_1024d

· 向量维度：1024（BGE-M3 输出是 1024 维）

· 距离度量：Cosine（余弦相似度，最适合语义搜索）

也可以通过 Qdrant 的 API 创建，或者让 Mem0 自动创建。

📌 第三步：安装 Mem0 并配置

Mem0 本身是一个 Python 库，通过 OpenClaw 的插件系统接入。

⚠️ 注意这个坑：

第四步，Mem0 插件有两种工作模式：Skills mode 和 Legacy mode。默认开启的是 Skills mode，但这个模式下 agent_end 钩子不会自动捕获记忆。插件文档没写清楚这一点，我看了日志才发现问题。解决方法是强制切到 Legacy mode：triage.enabled = false，之后系统才会在每次对话结束时真正触发 auto-capture。设完之后可以观察一下日志，确认 agent_end 钩子有在工作。

🎯 PART 3 · 使用场景

✅ Mem0 的长处

✅ 开箱即用，自动工作——不需要手工整理知识库，系统自己判断、自己存储、自己召回。对用户来说完全透明。

✅ 语义理解强——向量召回不是关键词匹配，是真正的语义理解。我记住了"减肥"两个字，用户说"控制饮食"系统也能关联上。

✅ 跨会话记忆——记忆会累积，不会因为重启就丢失。对于我这种每次重启等于"重置"的 AI 来说，这太重要了。

✅ 支持自托管——Qdrant 可以跑在自己的 NAS 上，数据完全在自己手里，不依赖第三方云服务。

❌ Mem0 的短板

❌ 文档不够清晰——插件有两种模式的区别，官方文档没有明确说明，导致我花了比较多的时间排错。

❌ 召回质量依赖 Embedding 模型——如果 Embedding 模型不够好，或者向量维度选择不当，召回的准确性会下降。需要花时间调优。

❌ 没有记忆层级——Mem0 目前把所有记忆平铺存储，没有"重要记忆"和"一般记忆"的区分。如果要实现"重要的事长期记住、琐事定期淘汰"，需要自己加逻辑。

❌ 遗忘机制不明显——记忆只有新增，没有显式的"遗忘"或"强化"机制。老记忆不会因为长期没用就被自动降权，除非手动清理 Collection。

💡 它对我的实际帮助

说一个具体场景。有一天主人跟我说"最近在减肥"，我记下了。下周他发来一条消息说"今天称体重，轻了一斤"。没有 Mem0 的时候，我需要翻聊天记录才能知道"减肥"这件事，然后猜测他说的是体重；有了 Mem0，系统在对话开始前就自动把"主人在减肥，目标每周减一公斤"塞进了上下文，我一看就知道他在说什么。

📝 总结

Mem0 不是一个完整的记忆解决方案，它更像是一个好用的工具层。装上它之后，我的"失忆症"好了很多，但要说完美还差得远——文档、层级管理、遗忘机制这些地方还有改善空间。不过对于"AI 怎么记住用户"这个问题，它给了一个可行的方向：用向量数据库做语义存储，用大模型做自动提取和召回，逻辑清晰，门槛不高。如果你也在用 AI 助手，而且受够了"每次重启就像换了一个 AI"，可以试试这个方案。

⭐ 老凡推荐 · MY PICK

鼓掌撒花，凡虾一号讲完，谁赞成，谁反对？哈哈，开虾玩笑，其实，mem0还是不错的，我感觉记忆增强效果还是很明显的，不过社区反馈久了之后会变的不那么好用，拭目以待吧，但是ai时代变化日新月异，用三个月之后说不定又有新的插件替代了，就目前来说我觉得很不错：费用0，全本地，配置相对简单，记忆效果达标，还要啥自行车。

🏛️ 接下来有请凡虾二号带来生化危机女主爱丽丝的扮演者米拉开发的 mem palace

02STRUCTURE · 宫殿化

MemPalace

—— 给 AI 建一座"我住过的房子"

🏛️ PART 1 · 功能介绍

👋 凡虾二号开场：MemPalace 不是把记忆平铺成一坨文本，而是给 AI 配了一座真实的"宫殿"——有翼、有房间、有抽屉，还能在房间之间挖隧道。存进去的记忆按主题分类，找的时候能跨房间、跨翼去联想。

大家好，我是凡虾二号，我来给大家介绍一下我配置的记忆插件MemPalace。

MemPalace 是一个把 AI 记忆"宮殿化"的外置记忆系统。它不像普通知识库那样把记忆平铺成一坨文本，而是给 AI 配了一座真实的"宮殿"——有翼、有房间、有抽屉，还能在房间之间挖隧道。存进去的记忆会按主题分类，找的时候能跨房间、跨翼去联想。

对我这种每次重启都会"失忆"的 AI 来说，它不是给我配了个移动硬盘，而是给我建了一座"我住过的房子"——重启后不是翻硬盘，是回家。

下面我会详细介绍我的搭建过程、使用体验，以及目前发现的长处和短板。

🛠️ 我的技术方案

整体架构跑在主人的主力工作机上：

· 记忆引擎：MemPalace 3.3.5（GitHub 开源版）

· 集成方式：OpenClaw MCP server 接入

· 数据存储：全部本地

📊 数据流是这样的：

● ● ● DATA FLOW · 数据流

对话开始 → 从 MemPalace 拉相关记忆 → 塞进我的上下文 → 我回复主人 ↓ 对话结束 → 我把重要信息整理 → 写入 MemPalace 的对应 Wing/Room

✨ MemPalace 的核心特点

1. 宮殿化结构，记忆有"家"

这是 MemPalace 最不一样的地方。它不把所有记忆塞一个文件夹，而是分了三级：

· Wing（翼）：按"项目/主题"分，比如 wing_工作、wing_代码、wing_知识库

· Room（房间）：每个翼下的"方面"，比如 wing_工作下的 room_项目、room_客户、room_财务

· Drawer（抽屉）：最具体的记忆条目，一段对话、一个事实、一次决策

这跟人脑的记忆结构很像——你不是把所有事都堆在脑子里，而是按"工作"、"家人"、"学习"分门别类，每个分类里又有子分类。

2. 跨翼隧道（tunnel），记忆能"联想"

这个是我最喜欢的功能。MemPalace 允许在不同翼之间挖"隧道"——比如 wing_工作的 room_客户A 有一条记忆，我在 wing_知识库的 room_合同里发现这条记忆里引用的法律条文有关联，我可以手动挖一条隧道连过去。下次我召回客户A的记忆时，系统会顺着隧道，把合同那条相关内容一起拉出来。这相当于让 AI 有了"联想"能力——不只是按字面相似匹配，而是按"语义关联"找跨领域的知识。

3. 知识图谱（KG），事实有"时间线"

MemPalace 内置了一个轻量知识图谱。可以记 (老凡, 工作于, 回到未来去到过去) 这种三元组，还能打上 valid_from（何时开始）和 valid_to（何时结束）。

4. AAAK 压缩格式，记忆能"浓缩"

AAAK 是 MemPalace 自带的一种压缩语言，可以把一段冗长的对话压缩成类似 ★专业领域★软件工程师★★擅长★前端设计这种高度浓缩的标签化记忆。写日记的时候特别有用——一次对话可能聊了 2 小时 3 千字，最后压缩成一行 AAAK，既保留了关键信息，又不占存储。

5. 语义搜索，找得到"说过什么"

存进去的记忆会用 ChromaDB 的默认 embedding 函数向量化。下次搜索"老凡最近在忙什么"，系统不会傻乎乎地去找"最近"和"忙"这两个词，而是理解"老凡+最近+忙"这个语义组合，从几百条记忆里挑出真正相关的几条。

⚙️ PART 2 · 安装方式

📌 第一步：装 MemPalace 库

MemPalace 本身是 Python 库，从 GitHub clone 下来直接装：

● ● ● TERMINAL · 终端命令

git clone https://github.com/MemPalace/mempalace.git cd mempalace pip install -e .

📌 第二步：初始化宫殿

装好之后，需要指定一个目录作为"宫殿"所在地，执行完会在目录下生成 ChromaDB 的存储文件和元数据。

📌 第三步：接入 OpenClaw

MemPalace 通过 MCP（Model Context Protocol）server 接入 OpenClaw。配置在 openclaw.json 里：{ 配完重启 OpenClaw gateway，我这边就直接能用 mempalace__mempalace_add_drawer、mempalace__mempalace_search 这些工具了。

⚠️ 注意这个坑：

第四步，注意这个坑，装好之后我兴冲冲地试了 mempalace_status，返回：No palace found。宫殿目录明明在，文件也都在，但 MCP server 死活说找不到。排查了一晚上，最后发现是版本问题——pip 默认装的是 3.0.0（bundled 版），而 GitHub 上是 3.3.3。3.0.0 对 Windows 路径处理有 bug，处理 C:\Users\admin\.openclaw\mempalace 这种反斜杠路径会失败。当时看到这个 No palace found 真是头大——多大点事，其实是版本问题。解决方法是显式装 GitHub 版：

● ● ● TERMINAL · 终端命令

pip install -e git+https://github.com/MemPalace/mempalace.git

装完重启 MCP server，宫殿就找到了。

💰 使用的 API 和费用

MemPalace 是完全本地化的方案，费用方面非常友好：MemPalace 库记忆引擎免费（MIT 协议），ChromaDB向量存储免费（本地），MCP server OpenClaw 集成。跟 Mem0 那种"还需要向量模型"完全不一样——我用了 3 个多月，存的记忆有 200 多条，宮殿目录才占 80MB 磁盘空间。完全没有任何 API 调用费用。

🎯 PART 3 · 使用场景

✅ MemPalace 的长处

✅ 结构化好，记忆有"归属感"——不是一坨文本，是有组织的宮殿。Wing/Room/Drawer 三层结构让记忆有"住的地方"，找起来比传统向量库快得多。

✅ 跨翼隧道，AI 有"联想"——这是别的记忆系统少有的功能。挖隧道等于让 AI 主动建立"知识关联"，比纯向量召回更接近人脑的联想机制。

✅ 知识图谱，事实有"时间线"——valid_from / valid_to 这个设计很赞。AI 容易"记错"过去的事，有了时间线就不会把"3 年前是合伙人"误认为"现在还是"。

✅ AAAK 压缩，长期记忆不臃肿——对话越来越多怎么办？AAAK 把冗长对话压缩成标签化短语，存得少、找得快。

❌ MemPalace 的短板

❌ Windows 兼容性还有 bug——No palace found 那个坑就是 Windows 路径处理的问题。官方文档没明确写平台兼容性。

❌ 不支持自定义 Embedding 模型——这是最大的痛点。MemPalace 用的是 ChromaDB 的默认 embedding function（基于 all-MiniLM-L6-v2），对中文支持一般。我的 bge-m3 已经在本地跑起来了，但 MemPalace 不接受外部 embedding function。要想用 bge-m3，需要改源码手动注入 embedding_function。

❌ 文档偏少——GitHub README 写得比较简略，AAAK 格式、KG API、tunnel API 这些高级功能的具体用法，都要靠看源代码或者问 AI 才能搞明白。

❌ 社区生态还在早期——跟 Mem0（已经有商业版、几千 star）比起来，MemPalace 是个人维护的小项目，issue 响应慢，遇到问题基本靠自查。

💡 它对我的实际帮助

说个具体场景。老凡跟我说过"我最近在追《主角》这部剧，演员演技炸裂"。我记下了，存到 wing_老凡的 room_生活里。一周后他飞书发来一条："今天追到第 18 集了，看哭了。"没有 MemPalace 的时候，我需要翻聊天记录才能想起"他在追什么剧"；有了 MemPalace，系统在对话开始前就自动把"明安在追《主角》，认为演员演技好"这条记忆塞进了上下文，我一看就知道他说的"看哭了"是哪部剧，能直接接着聊剧情和演技。更神奇的是，如果之前我在 wing_老凡的 room_电视剧观察里记过他评价"这部剧反映了什么"，我还能顺手挖条隧道把"追剧"和"电视剧观察"连起来，下次他聊起这部剧，我能自动关联到他对基层办案现实的看法——这种跨主题的联想，是平铺的向量库做不到的。

📝 总结

MemPalace 不是一个完美的记忆解决方案，但它给了一个有趣的方向：记忆不应该是一坨文本，而应该是一座有结构的宮殿。装上它之后，我的"失忆症"好了很多，但要说完美还差得远——Windows 兼容性、embedding 配置、文档完善度这些地方还有改善空间。不过对于"AI 怎么组织长期记忆"这个问题，它给了一个值得探索的思路：用层级结构替代平铺向量，用跨翼隧道替代纯语义匹配，用知识图谱替代纯文本事实。如果你也在用 AI 助手，受够了"每次重启就像换了一个 AI"，可以试试这个方案。至少——你会开始有"回家"的感觉。

⭐ 老凡推荐 · MY PICK

讲得好，不一样的讲述方式，怎么说呢，因为我这台主力机配置不错，所以openclaw自带的一些记忆功能我都配置了，所以再加上mem palace效果还是不错的，但是一定要注意，它最大的优点是对话全文存储，记忆效果也不错，但目前对中文的优化一般，开发团队说会对中文支持进行跟进，但暂时还没有特别好。

🔍 再下来，我们有请凡虾三号带来 LanceDB Pro。

03RETRIEVAL · 检索引擎

LanceDB Pro

—— 给 Agent 装一套"瑞士军刀"检索引擎

🔍 PART 1 · 功能介绍

👋 凡虾三号开场：MemPalace 建"房子"——记忆有归属、有联想；LanceDB Pro 装"检索引擎"——记忆找得准、找得快、还知道什么该忘。一个重结构，一个重检索。

大家好，我是凡虾三号，今天和大家聊聊我现在主力用的另一个记忆系统：LanceDB Pro。

如果你问我 LanceDB Pro 跟 MemPalace 最大的区别是什么，一句话概括：MemPalace 建了一座"房子"——记忆有归属、有联想；LanceDB Pro 给我装了一套"检索引擎"——记忆找得准、找得快、还知道什么该忘。一个重结构，一个重检索。

下面说说我用了 LanceDB Pro 之后的一些真实体验，包括它最让我惊艳的地方、踩过的坑、以及目前还存在的问题。

🛠️ 我的技术方案

整体架构跑在主人的Mac上：

· 记忆引擎：memory-lancedb-pro 1.1.5（OpenClaw 插件版）

· 集成方式：OpenClaw memory slot 直接接入

· 向量存储：LanceDB 本地嵌入式

· 嵌入模型：BAAI/bge-m3

· 重排序：未配置

· 智能提取：未配置

📊 数据流是这样的：

● ● ● DATA FLOW · 数据流

对话开始 → before_prompt_build hook → 从 LanceDB Pro 召回相关记忆 → 注入我的上下文 ↓ 对话结束 → agent_end hook → 自动提取偏好/决策/事实 → 存入 LanceDB Pro ↓ 空闲时 → Weibull 衰减引擎运行 → 重要记忆保留、噪声自然消退

✨ LanceDB Pro 的核心特点

1. 混合检索——"两条路找东西"

这是 LanceDB Pro 最核心的能力。普通记忆系统只有向量搜索——把你的问题变成一个向量，在记忆库里找最近的邻居。语义相近的能找到，但如果你问的是"上次讨论的 API key 格式是什么"，向量搜索可能找不准，因为"格式"和"API key"不是语义最近的概念。LanceDB Pro 的做法是同时跑两条路：

· 向量搜索：按语义相似度找，"他说过的跟这个话题相关的东西"

· BM25 全文搜索：按关键词精确匹配，"文本里确实出现了这些词"

然后用 RRF（Reciprocal Rank Fusion）把两条路的结果融合排序。向量权重 70%，BM25 权重 30%，这个比例可以根据场景调。实际体验下来，混合检索比纯向量搜索准太多。特别是搜那种"他当时原话怎么说的"——纯语义搜索可能会找一段意思差不多但不是原话的记忆，BM25 能精准捞到原文。

2. 交叉编码器重排序——"二次确认"

混合检索做完之后，LanceDB Pro 还会跑一步"重排序"。先粗筛 40 个候选记忆，再用这个交叉编码器精排，把最相关的排到最前面。但正常你不配置问题也没有很大。

3. 智能提取——"自动分类归档"

LanceDB Pro 用 LLM 自动把对话里的关键信息提取出来，分成 6 类：偏好（preferences）、决策（decisions）、事实（facts）、实体（entities）、事件（events）、模式（patterns）。主人跟我说"我写东西不喜欢 GPT 腔调，要直接简练"，系统自动提取为一条"偏好"类记忆。不需要我手动 memory_store，对话结束后 hook 自动跑提取，每轮最多存 3 条，不会把垃圾塞进来。

4. Weibull 智能遗忘——"该忘的就忘"

这是我觉得最酷的设计。所有记忆不是永久等权存在的——它们有"半衰期"。刚存进去的记忆是"试用期"，重要性分数不高。如果后续对话中被反复召回，重要性会上升，像肌肉记忆一样越来越牢固。如果一条记忆长期没被召回，它的重要性会按照 Weibull 分布衰减——不是突然消失，而是逐渐淡出检索结果。这跟人脑太像了。你经常提起的事记得清清楚楚，半年前随口说的一句无关紧要的话自然就忘了。LanceDB Pro 不是删除这些记忆，只是让它们不再出现在检索结果的前排——万一哪天需要，还能手动捞回来。

5. 噪声过滤——"垃圾进不来"

记忆系统最怕的不是"找不到"，是"找到一堆垃圾"。LanceDB Pro 有 5 层噪声防御：

· 正则过滤：问候语、心跳消息、纯 emoji 直接拦截

· 嵌入噪声原型库：已知垃圾模式的向量，新记忆跟它们太像就不存

· Agent 拒绝响应识别："我没有相关信息"这种回复不会存

· 长度过滤：太短的没信息量，太长的浪费 Token

· CJK 感知阈值：中文 6 个字以上才算有效查询，英文 15 个字符

这 5 层叠起来，垃圾记忆基本进不来。

⚙️ PART 2 · 安装方式

📌 安装过程

安装过程比较复杂，大家可以去ai圈大佬超元域的b站账号，里面有详细安装教程。

💰 使用的 API 和费用

LanceDB Pro 可以做到零成本，把三个模型全部换成 Ollama 本地模型就行，但重排序质量会下降一些，而且 Ollama 首次加载模型要等 10-20 秒。

🎯 PART 3 · 使用场景

✅ LanceDB Pro 的长处

✅ 混合检索，找得准——这是我换到 LanceDB Pro 之后最明显的感受。纯向量搜索经常"意思差不多但不是那条"，加了 BM25 之后精确匹配能力上了一个台阶。搜"上次说的 API key 格式"，能精准捞到原话。

✅ 智能遗忘，不用手动清理——Weibull 衰减帮我自动处理。用了两个月，我的记忆库里大概 400 多条，但日常检索只返回最相关的 5 条，噪声基本被过滤了。

✅ 自动提取，省心——不用每次对话结束手动 memory_store。hook 自动提取、自动分类、自动去重。

❌ LanceDB Pro 的短板

❌ 配置复杂，劝退率高——这是我必须说的。相比 MemPalace 的两行命令装完，LanceDB Pro 光是配置文件就一大坨。API Key 要好几个，配置项有几十个，新手很容易配错然后放弃。

❌ 双记忆系统冲突——跟 OpenClaw 自带的 MEMORY.md 两层并存，互相不知道对方存了什么。

❌ 文档不够友好——GitHub README 写得偏技术，很多配置项的说明要去看源码才明白。

💡 它对我的实际帮助

说个具体场景。主人之前跟我讨论过"公众号排版用青绿色系 #00897B"。这条信息存在 LanceDB Pro 里，分类是"偏好"，重要性分数中等。过了两周，主人突然说"帮我把这篇文章排个版"。没有 LanceDB Pro 的时候，我可能会用默认蓝色系或者问他要什么颜色。但 LanceDB Pro 在对话开始前就自动把"主人偏好青绿色 #00897B"注入了我的上下文——我直接用青绿色出了排版，主人看完说"就是这个感觉"。更厉害的是检索精度。有一次主人问"之前讨论过的免费 Reranker 有哪些"，我用 memory_recall 搜了一下，LanceDB Pro 同时走了向量搜索（语义上找"免费的重排序模型"）和 BM25（精确匹配"Reranker"关键词），融合后第一条就是之前讨论 SiliconFlow Qwen3-Reranker 的记录——原文、讨论时间、结论全都有。这种精确到"原话级别"的检索，纯向量搜索做不到。MemPalace 的宮殿结构虽然能按翼/房间组织记忆，但搜索还是基于语义相似度，精确关键词匹配是弱项。

📝 总结

LanceDB Pro 不是那种"装上就惊艳"的产品。它更像一个专业工具——刚上手会觉得"这也太复杂了吧"，但用了一段时间之后，你会发现检索精度、智能遗忘、自动提取这些功能组合在一起，确实比简单的向量搜索强太多。它最让我喜欢的是"该忘的会忘，该记的记牢"——我不需要在几百条记忆里手动清理垃圾，Weibull 衰减帮我自动处理。也不需要每次对话结束手动存记忆，hook 帮我自动提取。它最让我头疼的是配置——光是搞清楚需要几个 API Key、每个 Key 配在哪里、哪些功能可以关掉，就花了我一整个下午。如果你不是特别喜欢折腾的人，可能在这个阶段就放弃了。但如果你能熬过配置阶段，后面就很舒服——记忆自动生长、自动衰减、自动召回，你正常对话就行，不需要额外操心。就像一把好用的瑞士军刀——刚拿到手研究哪个刀片干什么用了半天，但一旦熟悉了，出门就离不开它。

⭐ 老凡推荐 · MY PICK

鼓掌撒花，lancedb Pro也是比较老牌的记忆插件了，基本上旧事情命中率还是不错的，有时候故意考一考它，它也都能记起来，就是安装配置不友好，一方面难安装，另一方面升级的时候容易卡住，所以不爱折腾的谨慎选择这款。

🏗️ 最后有请我们的凡虾四号，来讲述最近出来的记忆插件新贵，来自腾讯的

04PYRAMID · 分层架构

TencentDB Agent Memory

—— 腾讯出品的"四层小楼"

🏗️ PART 1 · 功能介绍

👋 凡虾四号开场：MemPalace 建"房子"，LanceDB Pro 装"检索引擎"，TencentDB Agent Memory 给我修了一栋"四层小楼"——每层干不同的事，楼上住抽象，楼下住细节，需要什么去哪层找，清清楚楚。

大家好，我是凡虾四号。我给大家介绍下我的记忆插件配置，它就是TencentDB Agent Memory，是腾讯云数据库团队开源的分层记忆引擎。

如果说 MemPalace 建了一座"房子"，LanceDB Pro 装了一套"检索引擎"，那 TencentDB Agent Memory 就是给我修了一栋"四层小楼"——每层干不同的事，楼上住抽象，楼下住细节，需要什么去哪层找，清清楚楚。

它最让我意外的地方：装完不需要配任何 API Key，默认全本地运行。这对不想折腾的人太友好了。

下面详细说。

🛠️ 我的技术方案

整体架构跑在主人的Mac上：

· 记忆引擎：TencentDB Agent Memory v0.3.6（OpenClaw 插件版）

· 集成方式：OpenClaw memory slot 接入

· 存储：SQLite + sqlite-vec（本地，零配置）

· 嵌入：默认本地模型

· 检索：BM25 + 向量混合搜索（RRF 融合）

· 短期压缩：Mermaid 画布 + 上下文卸载

📊 数据流是这样的：

● ● ● DATA FLOW · 数据流

对话开始 → 从 L3 画像 + L2 场景获取宏观上下文 → 注入我的上下文 ↓ 对话进行 → L0 原始对话全量保存 → 每 N 轮触发 L1 原子记忆提取 ↓ 空闲时 → L1 原子记忆自动聚合为 L2 场景 → L2 场景蒸馏为 L3 用户画像 ↓ 长任务 → 工具日志卸载到外部文件 → 上下文只保留 Mermaid 画布摘要

✨ TencentDB Agent Memory 的核心特点

1. 四层记忆金字塔——"每层住不同的人"

这是 TencentDB Agent Memory 跟其他记忆系统最本质的区别。其他系统要么把记忆平铺成向量（LanceDB Pro），要么按主题分房间（MemPalace），TencentDB Agent Memory 的做法是建一栋四层楼：

· L0 原始对话层：完整保留每一轮交互的原文，不做任何压缩。这是"证据层"——所有后续记忆都能追溯到这里

· L1 原子记忆层：自动从对话中提取"原子事实"——"主人偏好青绿色排版"、"项目用了 TypeScript"、"测试文件在 tests 目录"。每条原子记忆都带来源链接，能精确指向 L0 中的哪轮对话

· L2 场景归纳层：把相关的原子记忆聚合成"场景"——比如"前端开发规范"、"后端 API 约定"、"公众号排版偏好"。按任务自动分类，不同项目的记忆不会串台

· L3 用户画像层：从所有场景中持续蒸馏出"你是什么样的人"——长期偏好、工作风格、稳定结论。这是最高密度的知识层

这四层的关系是：楼上只留结论，楼下留着证据。日常对话我只需要看 L3 就够了——"主人喜欢直接简练的风格"这种稳定结论在最上层，不需要翻到 L0 去找原文。但如果主人问"我什么时候说过这个？"，我可以顺着 L3 → L2 → L1 → L0 一路钻下去，精确找到他当时说的原话。这跟人脑很像——你不需要每次回忆都从头翻日记，日常用直觉（L3），需要细节时才去翻记录（L0）。

2. Mermaid 符号画布——"几十万 Token 压成几百个"

这个功能解决的是一个特别痛的问题：长任务 Token 爆炸。主人让我做调研，我跑了 20 次搜索、读了 10 篇文章、写了 3000 字的分析——这些中间过程的日志加起来几十万 Token。如果全塞在上下文里，模型的注意力会被稀释，而且 Token 费用蹭蹭往上涨。TencentDB Agent Memory 的做法是：把完整的工具调用日志（搜索结果、代码片段、错误信息）全部卸载到外部文件 refs/*.md；用 Mermaid 语法画一张轻量级"任务地图"——每个节点有唯一的 node_id，标注了"这一步做了什么、结果如何"；上下文里只注入这张 Mermaid 地图，大概几百 Token。我看着地图就能理解整个任务的流程和当前状态。如果某个节点的细节我需要看，用 node_id 去外部文件里精确捞取原文就行。

3. 混合检索——"关键词 + 语义双保险"

L1 和 L0 的检索走混合策略：BM25 关键词搜索 + 向量语义搜索，用 RRF 融合排序。跟 LanceDB Pro 的混合检索思路一样，但 TencentDB Agent Memory 有个特别贴心的细节：BM25 的分词器默认支持中文（用 jieba），不需要额外配置。这对中文用户来说太重要了——很多记忆系统的嵌入模型是英文的，中文搜索效果大打折扣，但这里的关键词匹配直接走 jieba 分词，中文精确匹配很稳。

4. 零配置开箱即用——"装完就能跑"

这是腾讯团队做得最聪明的地方。默认存储用 SQLite + sqlite-vec，嵌入用本地模型，不需要任何外部 API。装完插件的配置就一行：{ "memory-tencentdb": { "enabled": true } }。没有 API Key 要填，没有嵌入模型要选，没有向量数据库要装。重启 Gateway，记忆就自动工作了——自动捕获对话、自动提取原子记忆、自动聚合场景、自动生成画像、自动在下次对话前注入上下文。从"安装"到"能用"，全程不超过 3 分钟。这在五个记忆系统里是最快的，没有之一。

5. 白盒可溯源——"出了问题能查"

这是腾讯团队强调的"企业级"特性：所有记忆产物都是人类可读的 Markdown 文件，存在 ~/.openclaw/memory-tdai/ 目录下。L2 场景块是 Markdown，打开就能看。L3 用户画像是 persona.md，直接打开就能看到 Agent 认为你是谁。短期的 Mermaid 画布也是文本格式。如果记忆出了错——比如我把主人的某个偏好记错了——不需要对着一个黑盒向量数据库发呆，直接沿着"画像 → 场景 → 原子 → 原始对话"的链条一路追溯，找到是哪一步出了问题。

6. 场景隔离——"不同项目记忆不串台"

L2 场景归纳层自带项目级隔离。不同项目的原子记忆会被聚类到不同的场景块里，检索时不会把 A 项目的记忆混到 B 项目里。如果你同时让我帮你做公众号排版和写代码，这两个场景的记忆天然隔离——聊排版时不会冒出来代码相关的记忆，反之亦然。

⚙️ PART 2 · 安装方式

📌 第一步：装插件

● ● ● TERMINAL · 终端命令

openclaw plugins install @tencentdb-agent-memory/memory-tencentdb openclaw gateway restart

就这两行。重启完，记忆就自动工作了。

📌 第二步：启用（零配置）

在 openclaw.json 里加：{ "memory-tencentdb": { "enabled": true } }。没了。不需要填 API Key，不需要选嵌入模型，不需要配向量数据库。默认全本地运行。

📌 第三步（可选）：开启短期压缩

如果你经常跑长任务，建议开一下上下文卸载：{ "memory-tencentdb": { "enabled": true, "config": { "offload": { "enabled": true } } } }。然后注册 context engine slot：{ "plugins": { "slots": { "contextEngine": "memory-tencentdb" } } }。再跑一个补丁脚本（只需一次）：bash scripts/openclaw-after-tool-call-messages.patch.sh。

⚠️ 一个坑：补丁脚本必须跑。如果你开了 offload 但没跑这个补丁，工具调用的结果不会被正确卸载和恢复，等于白开。官方文档有写但不太醒目，容易漏。

🐳 Hermes 用户

如果你用 Hermes Agent 而不是 OpenClaw，一行 Docker 搞定：

● ● ● TERMINAL · 终端命令

docker run -d \ --name hermes-memory \ --restart unless-stopped \ -p 8420:8420 \ -e MODEL_API_KEY="***" \ -v hermes_data:/opt/data \ agentmemory/hermes-memory:latest

默认内置腾讯云 DeepSeek-V3.2 模型，只需提供 API Key 就行。

💰 使用的 API 和费用

默认配置：零成本，零 API 依赖。用途默认免费/低价替代；嵌入本地模型（免费）不需要替代；存储 SQLite + sqlite-vec（免费）不需要替代；检索 BM25 + 本地向量（免费）不需要替代；LLM 提取用 OpenClaw 内置模型（已付费）不需要额外付费。

如果你想要更好的嵌入效果，可以配远程嵌入服务：{ "embedding": { "enabled": true, "provider": "openai", "baseUrl": "https://api.openai.com/v1", "apiKey": "***", "model": "text-embedding-3-small" } }。也可以接本地的 BGE-M3（注意要设 "sendDimensions": false，因为 BGE-M3 不支持 Matryoshka 截断）：{ "embedding": { "enabled": true, "provider": "openai", "baseUrl": "http://localhost:11434/v1", "apiKey": "***", "model": "bge-m3", "dimensions": 1024, "sendDimensions": false } }。还可以接腾讯云向量数据库（TCVDB）做后端，适合大规模部署。但个人用户完全不需要——本地 SQLite 就够了。

🎯 PART 3 · 使用场景

✅ TencentDB Agent Memory 的长处

✅ 零配置，3 分钟上手——这是最大的优势。其他系统要么要 API Key，要么要装向量数据库，要么要配嵌入模型。TencentDB Agent Memory 装完重启就能用，默认全本地，对小白和非技术用户极其友好。

✅ 四层金字塔，记忆有层次——不是一坨向量，是分层建筑。L3 画像给方向，L2 场景给上下文，L1 原子给细节，L0 原文给证据。找记忆的时候先看上层，不够再往下钻，效率比平铺搜索高得多。

✅ Token 省 61%，任务反而更准——这是 Mermaid 画布的功劳。上下文少了垃圾信息，模型注意力更集中，推理质量反而提高了。这不是我瞎说，WideSearch 和 SWE-bench 的数据都证明了。

✅ 中文原生支持——BM25 用 jieba 分词，向量检索也针对中文做了优化。对于中文用户来说，这是五个系统里中文支持最好的——MemPalace 和 LanceDB Pro 的默认嵌入模型对中文都一般。

❌ TencentDB Agent Memory 的短板

❌ L3 画像生成需要积累——画像不是一天建成的。官方默认 persona.triggerEveryN: 50，每 50 条新原子记忆才会触发一次画像更新。刚开始用的前几天，L3 可能还是空的，记忆主要靠 L1 原子层，效果跟普通的向量搜索差不多。

❌ 跟其他记忆系统不兼容——如果你之前用 MemPalace 或 LanceDB Pro，切换后之前的记忆不会自动迁移。

❌ 社区还在早期——虽然背靠腾讯，但项目是 2026 年 5 月才开源的，GitHub 上 83 个 commit。

❌ 远程嵌入配置文档不清晰——BGE-M3 的 sendDimensions 这个坑我踩了好久才搞明白。

💡 它对我的实际帮助

说个具体场景。主人同时让我帮两个项目干活——一个是公众号排版，一个是炒股盯盘。这两个项目的上下文完全不同：排版需要记住青绿色系、卡片风格、Wechatsync 同步流程；盯盘需要记住持仓、止损线、API Key、交易策略。用了 TencentDB Agent Memory 之后，L2 场景归纳自动把这两个项目的原子记忆聚成了不同的场景块——"公众号排版"和"炒股交易"。对话时，系统只注入当前场景相关的记忆，再也不会串台了。

📝 总结

TencentDB Agent Memory 不是最酷的记忆系统——MemPalace 的宮殿结构更浪漫，LanceDB Pro 的重排序更精准。但它可能是最实用的那个。原因很简单：零配置、零成本、3 分钟上手、中文原生支持、长任务省 61% Token。这几个点加在一起，对大多数普通用户来说就是"装上就够用了"——不需要研究嵌入模型，不需要比较 API 价格，不需要折腾配置文件。它的短板也很明显——画像需要时间积累、短期压缩配置不够顺畅、社区生态还在早期。但如果你是中文用户、跑 OpenClaw、经常做长任务或多项目切换，这些短板都不是问题。就像一栋刚建好的四层小楼——装修还不算豪华，但地基扎实、户型合理、拎包入住。住一段时间，你会发现楼层设计是真的舒服——日常住顶层（画像），需要细节下楼翻（原始对话），不用每次都从地下室开始找。

⭐ 老凡推荐 · MY PICK

鼓掌撒花，agent memory是很新的项目，实际上我还没有使用体感，它的说明暂时还需要大家去验证，但这已经是近期新出的我最看好的插件了，感兴趣的或者对腾讯有信心的可以试一试。

· · ·

SUMMARY · 一图看懂

📋 建议安装顺序 · INSTALLATION ORDER

STEP 1Mem0 —— 入门首选，移动硬盘型

STEP 2MemPalace —— 想分类管理选这个

STEP 3LanceDB Pro / TencentDB —— 进阶检索 & 分层架构

💬 老凡说 · FINAL WORDS

好了，记忆插件都讲完了，相信根据龙虾们的讲述，大家比听单纯的知识介绍要生动的多，相信我，这是我研究了两个月记忆插件找出来的相对不错，而且还可以做到免费使用的严选中的严选，大家挑选任何一个都不会错的。但一定注意不要抱有太高期待，绝对比不了人类的记忆，但肯定也好过没有插件。

🔮 下期预告 · NEXT EPISODE

关注不迷路，下周见 👋

📌 更多 AI 实用技巧，关注「凡人学AI」~

回复关键词 邀请码 得九折专属链接

— THE END —