AI记忆的四重进化:从「搜到什么算什么」到「记多了就会做」

AI记性越来越好了——但「好记性」从来不是终点

从RAG到Skill自进化，AI记忆正在经历一场比我们想象得更深刻的变革。而我发现，这场变革的终点，根本不是「记得更多」。

上个月我写过一篇文章，讲微软的Mnemis框架如何让AI「在存储时就把结构建好」。发完之后，后台收到一条让我愣了两秒的留言：

「所以AI记性变好了，然后呢？」

这问题问得太好了。我想了一个星期，又翻了一遍最近收录的相关研究，发现答案比想象中更大——

AI记忆正在经历的不是一次技术升级，而是一场范式跃迁。而且这场跃迁的终点，不是「记更多」，是「会做」。

第一层：RAG——一个「搜到什么算什么」的笨办法

今天90%的AI应用在用的记忆方案，叫做RAG（检索增强生成）。

原理不复杂：把你跟AI的所有对话切成碎片→转成数学向量→扔进数据库。下次你提问，AI从数据库里捞几个「语义最相似」的碎片，塞进上下文参考。

听起来合理。但它有个致命问题：「语义相似」不等于「真正相关」。

你在一次长对话里随口说过「2023年我去底特律参加了一场会」。三个月后你问AI「我2023年去过哪些城市」——它给你的答案里大概率没有底特律。

因为「参加过一场会」跟「去过哪些城市」之间，向量距离太远了。RAG找不到它。

这不是个别漏洞。这是RAG架构的天花板——它把所有精力都押在「检索时怎么搜」，而「存储时」什么都没做，就是切碎、编码、入库。

就像一个图书馆只按书名找书，从来没人给书编过目录。

第二层：Mnemis——「整理书架比翻书更重要」

微软的方案叫Mnemis，已经被ACL 2026主会议接收。

它的核心思路跟RAG完全相反： 不要在提问时才想怎么找——要在存储时就把结构建好。

具体来说，Mnemis在两条路径上同时发力：

一、把碎片化对话变成「知识图谱」。实体、关系、去重、聚合——你的每一次对话不是被切碎扔进库，而是被织进一张网。

二、在这张知识图谱之上再建一层「层级概念图」。底特律、旧金山被归入「地理位置」，地理位置再归入「地理」。顶层是几个大类，底层是所有具体信息——自顶向下随时可以定位任何一条记忆。

这相当于： 每次跟AI聊完，它不是在「存档」，而是在帮你「整理书架」。 分类、归位、标注索引——这些事在存储时就已经做完了。

在LoCoMo基准上准确率93.9%，LongMemEval-S上91.6%。而且用的只是GPT-4.1-mini——说明不是靠大力出奇迹，是框架设计本身的有效性。

第三层：OpenViking——「知道什么时候该想起什么」

但 Mnemis 解决的是「记什么」和「怎么组织」的问题。它没解决另一个关键问题：

什么时候该想起什么。

你想想人类记忆的运作方式。你不会在每次遇到一个人时，把你关于这个人的所有记忆全部调用一遍。你的大脑会自动判断：现在这个场景下，哪些记忆是相关的，哪些不是。

OpenViking 就是在做这个——记忆的运行时调度。

它把记忆分成不同层级：短期工作记忆（当前对话窗口）、近期情景记忆（最近几次交互）、长期语义记忆（知识库和结构化信息）。每次AI需要做决策时，OpenViking不是把所有记忆一股脑塞进去，而是动态选择当前最相关的几层。

这听起来技术味很重，但用日常生活来类比很简单——

RAG是你把一辈子写过的东西全摊在桌子上，每次用的时候翻一遍。
Mnemis是你把东西整理进了文件夹和书柜，找的时候按分类找。
OpenViking是你有了一个助理，他知道你今天要见什么人、谈什么事，提前帮你把相关文件抽出来，摆在你手边。

从「被动存储」到「主动建构」，再到「按需调取」——一条进化线已经清晰可见。

第四层：Skill自进化——「记得多了，最终会变成会做」

但走到这里，我问自己一个问题：这条进化链的终点在哪？

清华最近的研究给出了一个让人兴奋的答案： Skill自进化。

一个Agent在反复执行某类任务后，不再每次从头推理。它会从自己的执行历史中自动提取可复用的操作模式，封装成「技能」。下次遇到类似任务，直接调用技能，而不是重新推理。

这意味着什么？

记忆的终极形态不是「记信息」，是「长出能力」。

想想你学开车的过程。一开始你刻意记每一个步骤：看后视镜、打转向灯、松离合、给油。每次都要「检索」一遍操作手册。

开了一千公里之后，你不需要「记」怎么开车了——你不会在变道前想「根据操作手册第3章，变道需要先看后视镜」。你「会」开车。

这就是Skill自进化在AI上做的事：让AI从「每次都要查笔记」变成「这件事我已经会了」。

全景图：四重进化链

把这四个层级放在一起看，一条完整的进化路径浮现出来：

层级	方案	核心能力	一句话
第一层	RAG	检索补救	「搜到什么算什么」
第二层	Mnemis	存储建构	「先整理好再找」
第三层	OpenViking	运行时调度	「知道什么时候该想起什么」
第四层	Skill	能力自进化	「记多了就会做」

每一层解决一个更根本的问题。而且你会发现，每一层都不否定上一层——RAG的向量检索仍然有用，Mnemis的知识图谱建在RAG之上，OpenViking在Mnemis的结构上加了一层调度逻辑，Skill在所有这些之上做模式提取。

这不是替代关系，是叠加关系。

但还有一层：组织记忆的提纯

上面说的都是单个AI的记忆。还有一个维度被很多人忽略了——

组织级记忆。

一个团队里，每个人跟AI说了不同的话，做了不同的任务。这些分散的记忆，怎么提炼成整个组织的能力？

我一直在想这个问题。RAG记的是碎片，Mnemis建的是个人知识图谱，OpenViking管的是个人记忆调度——但还没有一个框架在解决： 一群人跟AI交互产生的集体记忆，如何被抽象、提纯，变成整个团队的生产力？

这可能就是第五层了。

写在最后

这篇文章断断续续写了好几天。每次想收尾，脑子里又冒出新的线索。

但有一点越来越清晰： 人类之所以是人类，不是因为能记住更多东西，而是因为「记住」最终转化成了「会做」。

一个实习生，第一周每次都要问「这个流程怎么走」。三个月后他不问了，不是因为他把所有答案背下来了——是因为他「会」了。

AI记忆的进化路径，其实跟人一模一样：从记住碎片，到建立结构，到按需调取，到长出能力。

而组织记忆的提纯——让一群AI都「会」——可能是下一步最值得关注的方向。

好记性不是终点。会做，才是。

参考资料：
- Mnemis (Microsoft, ACL 2026): arxiv.org/abs/2602.15313
- OpenViking: 多智能体记忆管理与运行时调度
- 清华Skill: Agent自主技能提取与自进化