太长不看
用户不真正忠诚于某个 AI 产品,而是追随当下最新、最快、最好用的能力。 模型能力可以带来试用和迁移,但未必带来长期留存;AI 产品真正焦虑的是用户下一次还会不会回来。 Memory 的价值不是一个小功能,而是把一次性使用变成长期关系:它记住用户的表达偏好、审美习惯、项目状态和判断标准,让用户觉得这里不只是一个模型入口,而是可以长期工作的窗口。
这半年,AI 图像产品给了一个很好的样本。
一个新模型出来,速度更快,效果更稳,社交平台上立刻开始刷屏。用户一拥而上,教程、提示词、案例、对比图跟着铺开。
过几个月,另一家公司把图像模型升级,质量、编辑能力、入口体验又上来一截,用户又开始把工作流搬回去。
用户此刻忠诚的不是某个品牌,不是某个聊天框,也不是某个模型家族。用户忠诚的是一个更朴素的东西:现在谁最好用,我就去哪。
Nano Banana 2 这类图像模型升级,会把用户拉向 Gemini;GPT Image 2 / ChatGPT Images 2.0 这类升级,又会把用户拉回 GPT。
官方资料能确认的是,Google 和 OpenAI 都在把图像能力快速升级,并接入自己的主产品、API 和创作工具。至于“全球用户如何迁移”,还需要平台热度、流量数据继续验证。
但作为产品现象,它已经足够说明问题:在 AI 产品里,能力会带来使用,未必带来留存。
只是能力迭代越快,用户越习惯追随当下最好用的工具:哪里有最新能力,哪里有更好效果,哪里交付更舒服,就往哪里走。
这才是通用 AI 产品真正焦虑的地方。
不是这一次回答能不能赢,而是用户下一次还会不会回来。
通用 AI 的框架正在变得相似
今天的主流 AI 产品,越来越像。
它们都有一个聊天入口,有文件上传,有联网搜索,有代码或数据分析工具,有图像、视频、语音能力,有项目空间,有连接器,有移动端,有桌面端。技术路线不同,名字不同,按钮位置不同,但大的产品骨架已经越来越接近。
可以把它叫成一个 Harness 架构。
也就是一套把模型能力接到真实工作流里的外壳:模型在里面负责生成、理解、推理,工具负责执行,文件负责上下文,连接器负责把外部资料拉进来,多模态入口负责接住图片、语音、视频和屏幕。
当这套框架还没成型时,产品竞争主要是“有没有”。
有没有联网、能不能读文件、会不会生成图片、能不能接 Google Drive、Gmail、Notion、GitHub 等等。
但当这些东西都逐渐变成标配,竞争就会变成另一件事:用户为什么要把自己的长期工作流放在你这里?
这和传统软件不一样。
传统软件一旦进入工作流,迁移成本很高。团队文档在这里,历史记录在这里,权限体系在这里,模板和自动化也在这里。你要换一个软件,不只是下载新 app,而是要搬家。
AI 产品现在还没有那么深。
很多用户打开 AI,只是在“调用一次能力”:帮我写一段,帮我改一张图,帮我查个资料,帮我写个脚本。一次任务结束,关系也结束。下一次,如果别的产品更强,他当然会走。
所以 AI 产品的下一场竞争,不只是模型能力竞争,而是留存率竞争。
谁能把一次次调用,变成持续关系,谁才有机会留下用户。
Memory 不是装饰,而是留存装置
这就是为什么 Claude、ChatGPT 以及其他 AI 产品都在加速做 memory。
很多人第一次听到 AI 记忆,会把它理解成一个拟人化功能:它记得我是谁,记得我喜欢什么,记得我上次说过什么。
这当然有用,但还不够。
更深一层看,memory 是通用 AI 产品的留存装置。
一个没有记忆的 AI 产品,再强,也像一个临时工。你每次打开它,都要重新交代背景:我是谁,我在做什么,我不喜欢什么风格,这个项目之前为什么这样定,哪些方案已经试过,哪些坑不能再踩。
它可能很聪明,但它永远像第一天上班。
而一个有长期记忆的 AI,不只是省掉重复输入。它会慢慢贴近你的表达偏好、审美偏好、交付习惯和判断标准。
你写文章,它知道你不喜欢“总分总”的腔调,也知道你想要观点更锋利一点,但不要失控成情绪宣泄。
你做图,它知道你不喜欢太抽象的科技感,不喜欢一眼 PPT 模板,不喜欢颜色过于朴素,也知道你偏好清晰的视觉冲突。
你做产品分析,它知道你不满足于功能罗列,你更关心这件事背后的商业逻辑、用户心理和竞争格局。
这些东西很难一次说清楚,但它们决定了用户每一次交付时的感受。
好的 AI 输出,不只是“对”,还要“像我想要的那样对”。这种微妙的贴合,会带来一种很强的确认感:它懂我。
这不是浪漫化 AI,而是产品留存最朴素的心理机制。
用户会为效率留下,也会为愉悦感留下。尤其是创作型任务里,用户要的不是一个平均正确的答案,而是一个不断接近自己偏好的协作者。
模型能力让用户进门,Memory 让用户觉得,这里已经有我的痕迹,是我可以长期工作的窗口。
Claude 的“永久大脑”,真正该这样看
最近中文科技圈讨论 Claude 的“永久大脑”,很多标题写得很大:双记忆系统、Memory Files、Dreams、Conway Agent。
这些词当然有传播力,但容易把问题带偏。
更准确的看法是:Claude 正在把 memory 从一个聊天体验,做成一种状态层。
官方已经确认的部分包括几条线。
Claude Chat 已经有聊天历史记忆,会把过往对话合成为 memory synthesis。Claude Code 有 CLAUDE.md 和 Auto memory,前者像人写的项目说明,后者像 Claude 自己沉淀下来的工作经验。
Claude API 有 Memory Tool,开发者可以让 Claude 在不同对话之间读写记忆文件。Managed Agents 里,Anthropic 甚至把 memory 设计成文件式、可共享、可审计、可回滚、可删除的生产基础设施。
还有 Dreams,这个名字很容易让人想多:好像 AI 睡一觉就进化了。
但工程上看,它更像一次后台整理。它读取过去的 sessions 和 memory stores,把重复的、矛盾的、过期的东西整理掉,再输出一个新的 memory store。不是神秘的自我意识,而是给长期工作的 agent 清缓存、删旧账、重建索引。
这件事为什么重要?
因为一旦 AI 要从“回答机器”变成“工作系统”,它就不能只靠当前对话窗口活着。
它需要知道这个项目从哪里来,之前为什么这么决定,哪些偏好是稳定的,哪些经验已经过期,哪些东西不能继续带入下一次任务。
对企业来说,这是协作和合规问题;对普通用户来说,这是体验和留存问题。
一个 AI 产品如果能把你的长期偏好、项目材料、历史判断和创作习惯沉淀下来,它就不再只是一个模型入口。它开始变成你自己的工作现场。
这时候,你当然还是会去试最新模型,但你会不会把主工作流搬走,就变成另一回事。
记忆越长期,越需要被管理
不过,memory 也不是越多越好,有记忆的 AI 更有用,也更危险。
无状态聊天机器人的错误,通常停在当前对话里。说错了,关掉窗口,影响也就结束了。
但有长期记忆的 AI,一旦记错,就可能把错误带到未来。它可能记住一个过期偏好,记住一个你后来已经否定的方案,记住一次被误导的信息,甚至把外部攻击写进长期记忆里。
微软安全博客里提到过类似风险:攻击者可以通过隐藏提示或恶意链接影响 AI assistant 的记忆,让未来推荐持续偏向某些结果。这类 memory poisoning 不是一次对话污染,而可能变成跨会话污染。
所以真正好的 memory,不是“什么都记住”。
而是会记,也会忘;会总结,也保留证据;会个性化,也允许用户查看、修改、删除、回滚。
这也是为什么 Claude 的 memory 如果只是“永久大脑”,反而说窄了。真正关键的是,它能不能把记忆变成一个可读、可改、可审计的对象。
用户需要的不是一个永远记得所有事的 AI。
用户需要的是一个知道什么该记、什么该忘、什么时候该问一句“这还是你想要的吗”的 AI。
下一场战争,是让用户愿意回来
AI 产品竞争走到今天,能力当然还会继续卷。
图像会更好,视频会更好,代码会更好,搜索会更好,语音会更自然。每一次能力跃迁,都会带走一批用户注意力。
这很正常,因为用户本来就没有义务忠诚。
但对通用 AI 产品来说,只靠能力领先很难长期锁住用户。能力是潮汐,今天涨到你这里,明天可能涨到别人那里。
真正能沉淀下来的,是状态。
你的项目状态、表达状态、素材状态、审美状态,还有你的工作习惯和判断标准。
当这些东西沉在一个 AI 产品里,用户才会从“来试试这个模型”变成“我还是回这里继续做事”。
所以,memory 不是 AI 产品里的小功能,而是通用 AI 从一次性工具变成长期关系的关键一步。
下一场 AI 产品战争,表面看是模型能力战,底下看是留存率战争。
再往深处看,是谁能更持续地让用户感到:这里不只是有一个更强的模型,这里还有我的工作痕迹、我的表达习惯、我的判断标准。
用户下一次还会不会回来,答案可能就藏在这里。
比如我,交了两个月 Claude Code Max 订阅费之后,也想重回 ChatGPT 的怀抱了。
夜雨聆风