AI记性越来越好了——但「好记性」从来不是终点
从RAG到Skill自进化,AI记忆正在经历一场比我们想象得更深刻的变革。而我发现,这场变革的终点,根本不是「记得更多」。
上个月我写过一篇文章,讲微软的Mnemis框架如何让AI「在存储时就把结构建好」。发完之后,后台收到一条让我愣了两秒的留言:
「所以AI记性变好了,然后呢?」
这问题问得太好了。我想了一个星期,又翻了一遍最近收录的相关研究,发现答案比想象中更大——
AI记忆正在经历的不是一次技术升级,而是一场范式跃迁。而且这场跃迁的终点,不是「记更多」,是「会做」。
第一层:RAG——一个「搜到什么算什么」的笨办法
今天90%的AI应用在用的记忆方案,叫做RAG(检索增强生成)。
原理不复杂:把你跟AI的所有对话切成碎片→转成数学向量→扔进数据库。下次你提问,AI从数据库里捞几个「语义最相似」的碎片,塞进上下文参考。
听起来合理。但它有个致命问题:「语义相似」不等于「真正相关」。
你在一次长对话里随口说过「2023年我去底特律参加了一场会」。三个月后你问AI「我2023年去过哪些城市」——它给你的答案里大概率没有底特律。
因为「参加过一场会」跟「去过哪些城市」之间,向量距离太远了。RAG找不到它。
这不是个别漏洞。这是RAG架构的天花板——它把所有精力都押在「检索时怎么搜」,而「存储时」什么都没做,就是切碎、编码、入库。
就像一个图书馆只按书名找书,从来没人给书编过目录。
第二层:Mnemis——「整理书架比翻书更重要」
微软的方案叫Mnemis,已经被ACL 2026主会议接收。
它的核心思路跟RAG完全相反: 不要在提问时才想怎么找——要在存储时就把结构建好。
具体来说,Mnemis在两条路径上同时发力:
一、把碎片化对话变成「知识图谱」。实体、关系、去重、聚合——你的每一次对话不是被切碎扔进库,而是被织进一张网。
二、在这张知识图谱之上再建一层「层级概念图」。底特律、旧金山被归入「地理位置」,地理位置再归入「地理」。顶层是几个大类,底层是所有具体信息——自顶向下随时可以定位任何一条记忆。
这相当于: 每次跟AI聊完,它不是在「存档」,而是在帮你「整理书架」。 分类、归位、标注索引——这些事在存储时就已经做完了。
在LoCoMo基准上准确率93.9%,LongMemEval-S上91.6%。而且用的只是GPT-4.1-mini——说明不是靠大力出奇迹,是框架设计本身的有效性。
第三层:OpenViking——「知道什么时候该想起什么」
但 Mnemis 解决的是「记什么」和「怎么组织」的问题。它没解决另一个关键问题:
什么时候该想起什么。
你想想人类记忆的运作方式。你不会在每次遇到一个人时,把你关于这个人的所有记忆全部调用一遍。你的大脑会自动判断:现在这个场景下,哪些记忆是相关的,哪些不是。
OpenViking 就是在做这个——记忆的运行时调度。
它把记忆分成不同层级:短期工作记忆(当前对话窗口)、近期情景记忆(最近几次交互)、长期语义记忆(知识库和结构化信息)。每次AI需要做决策时,OpenViking不是把所有记忆一股脑塞进去,而是动态选择当前最相关的几层。
这听起来技术味很重,但用日常生活来类比很简单——
RAG是你把一辈子写过的东西全摊在桌子上,每次用的时候翻一遍。
Mnemis是你把东西整理进了文件夹和书柜,找的时候按分类找。
OpenViking是你有了一个助理,他知道你今天要见什么人、谈什么事,提前帮你把相关文件抽出来,摆在你手边。
从「被动存储」到「主动建构」,再到「按需调取」——一条进化线已经清晰可见。
第四层:Skill自进化——「记得多了,最终会变成会做」
但走到这里,我问自己一个问题:这条进化链的终点在哪?
清华最近的研究给出了一个让人兴奋的答案: Skill自进化。
一个Agent在反复执行某类任务后,不再每次从头推理。它会从自己的执行历史中自动提取可复用的操作模式,封装成「技能」。下次遇到类似任务,直接调用技能,而不是重新推理。
这意味着什么?
记忆的终极形态不是「记信息」,是「长出能力」。
想想你学开车的过程。一开始你刻意记每一个步骤:看后视镜、打转向灯、松离合、给油。每次都要「检索」一遍操作手册。
开了一千公里之后,你不需要「记」怎么开车了——你不会在变道前想「根据操作手册第3章,变道需要先看后视镜」。你「会」开车。
这就是Skill自进化在AI上做的事:让AI从「每次都要查笔记」变成「这件事我已经会了」。
全景图:四重进化链
把这四个层级放在一起看,一条完整的进化路径浮现出来:
| 层级 | 方案 | 核心能力 | 一句话 |
|---|---|---|---|
| 第一层 | RAG | 检索补救 | 「搜到什么算什么」 |
| 第二层 | Mnemis | 存储建构 | 「先整理好再找」 |
| 第三层 | OpenViking | 运行时调度 | 「知道什么时候该想起什么」 |
| 第四层 | Skill | 能力自进化 | 「记多了就会做」 |
每一层解决一个更根本的问题。而且你会发现,每一层都不否定上一层——RAG的向量检索仍然有用,Mnemis的知识图谱建在RAG之上,OpenViking在Mnemis的结构上加了一层调度逻辑,Skill在所有这些之上做模式提取。
这不是替代关系,是叠加关系。
但还有一层:组织记忆的提纯
上面说的都是单个AI的记忆。还有一个维度被很多人忽略了——
组织级记忆。
一个团队里,每个人跟AI说了不同的话,做了不同的任务。这些分散的记忆,怎么提炼成整个组织的能力?
我一直在想这个问题。RAG记的是碎片,Mnemis建的是个人知识图谱,OpenViking管的是个人记忆调度——但还没有一个框架在解决: 一群人跟AI交互产生的集体记忆,如何被抽象、提纯,变成整个团队的生产力?
这可能就是第五层了。
写在最后
这篇文章断断续续写了好几天。每次想收尾,脑子里又冒出新的线索。
但有一点越来越清晰: 人类之所以是人类,不是因为能记住更多东西,而是因为「记住」最终转化成了「会做」。
一个实习生,第一周每次都要问「这个流程怎么走」。三个月后他不问了,不是因为他把所有答案背下来了——是因为他「会」了。
AI记忆的进化路径,其实跟人一模一样:从记住碎片,到建立结构,到按需调取,到长出能力。
而组织记忆的提纯——让一群AI都「会」——可能是下一步最值得关注的方向。
好记性不是终点。会做,才是。
参考资料:
- Mnemis (Microsoft, ACL 2026): arxiv.org/abs/2602.15313
- OpenViking: 多智能体记忆管理与运行时调度
- 清华Skill: Agent自主技能提取与自进化
夜雨聆风