上周我在DeepSeek里聊了一个小时的项目方案。客户需求、架构设计、推进方案。
第二天打开,它问我:"请问你想聊什么?"
就像你跟同事开了一下午的会,第二天他坐在你对面,一脸空白。你要和他说,打开上周三的记事本哦。
这件事不是个例,是常态。AI越来越聪明,回答越来越溜,但每次新开一个对话,它就像第一天入职的实习生。你得从零交代背景,重新说一遍需求,再把上周的上下文喂一遍。
也就是说,这个实习生记笔记,但不怎么会看。
所以hermes-agent火了
NousResearch出的这个项目,这周冲上了GitHub热榜。slogan很直白:"The agent that grows with you",会随使用成长的Agent。
180k+的star数说明一件事:AI记忆,从小众极客的需求变成了大众刚需。大家受够了每次对话都要重新自我介绍。
hermes-agent的思路是持久记忆加自动学习技能。你和它聊过什么,它存下来。下次对话,理论上能接上。
听起来很好。但用起来你会发现一个问题。
它记住了你和A聊过供应链,记住了供应商名单。但下次你和它聊B项目的时候,它不会主动说:"上次你和A聊的那个供应商,B也在找。"
它有记忆,但不会用记忆。信息躺在那里,像一本合上的笔记本。
hermes-agent不是唯一做记忆的。横看一圈,赛道已经挺热闹。
OpenClaw,380k stars,本地运行的个人AI助手。有记忆模块,能存你的偏好和历史。但它是被动检索的范式,你不问,它不说。像一个有档案柜的老员工,你问什么他都能翻出来,但从来不主动提醒你。
Mem0,最早的AI记忆层之一。用RAG做检索,你问它就搜,搜到就答。问题是缺分类,也缺规则。所有记忆混在一起,分不清哪个是偏好,哪个是事实,哪个是规则。就像你的书架,书都在,但没分类标签,找一本具体的书得一本一本翻。
MemOS,走得更远,做全栈记忆操作系统。有反思层,能回顾和修正记忆。PrefEval成绩77.2%,不算差。但注入机制弱,记忆有了,主动塞进对话的能力不够。相当于这个秘书很聪明,记性也好,但总是等老板开口才说话。
MemPalace,语义检索很强,LongMemEval跑到了96.6%。检索能力一骑绝尘。但缺分类,缺规则。能找到,但不知道找到的东西该什么时候用、怎么用。
发现没有?这些项目有一个共同的范式:检索记忆。
用户问了问题,系统去记忆库里搜,搜到相关的,塞进上下文,生成回答。
检索记忆像你家的书架。书都在,但你得知道自己要找什么,才能找到。你不知道自己不知道什么,就永远翻不到那一页。
主动注入不一样
主动注入是你手机里那个总提醒你"别忘了周三见张总"的助手。你什么都没问,但它知道你周三有约,知道张总上次谈到了付款条件,所以在你开始新对话的时候,它就已经把这些信息摆在桌上了。
区别不是信息量,是信息的到达方式。
检索记忆解决的是"找得到"的问题。主动注入解决的是"不用找"的问题。
打个更具体的比方。一个跟了你三年的秘书,和一个有十年档案的档案管理员。档案管理员什么都有,但你得告诉他你要什么。秘书不需要你开口,她知道你周三见谁,知道你不吃香菜,知道你跟A聊过供应商的事。
这就是从检索到注入的跃迁。不是记更多,是记得更对,而且在对的时候自己冒出来。
CarryMem的做法,是先给记忆做分类,再主动注入。
不是把所有东西扔一个筐里,而是分了7个格子。每个格子解决一种问题。
identity,身份记忆。你是谁,你的角色是什么。一个产品经理和一个前端开发,需要被记住的身份信息完全不同。这解决了"AI不知道在和谁说话"的问题。像你第一次去理发店,发型师问"您之前来过吗",如果他有身份记忆,你不用每次都解释自己要什么风格。
preference,偏好记忆。你回复要简洁还是详细,喜欢用Python还是Go。偏好不是事实,是倾向。记住偏好,AI就不用每次都问"您需要详细版还是简洁版"。像你常去的那家面馆,老板知道你加辣不加香菜,你坐下他就端对了,不用你开口。
fact,事实记忆。你住在哪个城市,你用的什么技术栈。事实是确定的,短期内不变。这是最基础的记忆类型,但也是最容易被和其他类型混在一起的。你的身份证号是事实,你喜欢吃辣是偏好,分开存才不会搞混。像你租房的时候,合同上写的面积是事实,你觉得厨房太小是偏好,两个东西两种处理方式。
rule,规则记忆。"回复用中文""不要超过200字""不要提竞品"。规则是你给AI画的边界。没有规则记忆,你每次对话都要重新说一遍禁忌。像公司里的合规手册,不用你每次提醒,它自己知道什么能说什么不能说。
procedure,流程记忆。你写周报的步骤,你做代码review的顺序。流程是步骤,不是结果。记住流程,AI能按你的习惯做事,而不是每次都用默认流程。像你带新人的时候,不用每次都说"先看需求文档,再写方案,最后评审",他记住了流程,下次自己就按顺序来了。
relationship,关系记忆。你和A是同事,和B是甲方,C是你前领导。关系决定了AI该用什么语气、什么信息可以共享。没有关系记忆,AI可能把跟甲方的说法用在同事身上。你不会跟老板聊的话题,你会跟室友聊,关系记忆就是让AI也懂这个分寸。
event,事件记忆。上周二你开了个会,会上决定延期。事件是有时间、有参与人、有结论的。不是模糊的"之前聊过",是"3月12日,A、B在场,决定延期到Q2"。像你的日历,每个事件都清清楚楚,不是"大概好像也许上个月聊过"。
7种记忆不是拍脑袋分的。每种对应一种"AI不懂你"的具体场景。合在一起,就是一个人从陌生人变成熟人的完整路径。
记住身份是认识你,记住偏好是了解你,记住事实是知道你,记住规则是尊重你,记住流程是配合你,记住关系是分寸感,记住事件是和你同频。
单一的记忆类型做不好这件事。就像厨房里7个调料盒,盐是盐,糖是糖,酱油是酱油,全混在一个瓶子里,每道菜都是一个味道。
但CarryMem关键是注入方式。记忆不是躺在库里等检索,而是主动写入system prompt。每次你开始新对话,相关的记忆就已经在那了。不用你问,不用你提。
PrefEval基准测试
CarryMem跑了83.0%,对比MemOS的77.2%。reminder场景80.0%,zero-shot 71.5%。
数字不撒谎。主动注入比被动检索,在"AI能不能记住并使用你的偏好"这件事上,效果好一个档次。6个点的差距,就是偶尔提醒你和每次都懂你之间的距离。
开源在github.com/lulin70/,口号是:"Don't remember everything. Remember what matters."
昨天我又开了个新对话。这次不一样。
它知道我叫什么,知道我写代码用Python,知道我回复要简洁,知道我周三要见张总。
它什么都没等我问。你坐下,文件已经翻到了那一页。
#AI记忆#AI助手#CarryMem
夜雨聆风