OpenAI 的新护城河:记忆

ChatGPT 最近最重要的变化，看起来一点也不性感。

没有新模型，没有跑分屠榜，也没有足够刷屏的视频演示。OpenAI 更新的是 Memory：让 ChatGPT 更好地保持上下文更新，减少过时和互相矛盾的记忆，更准确地理解用户偏好、目标和正在推进的工作。

放在发布会上，这句话大概很难赢得掌声。

高频用户却最先感受到这种变化。因为他们真正痛苦的，从来不是 ChatGPT 不会回答，而是每次都要重新解释自己。

AI 最早让人惊讶，是因为它“会”。会写，会算，会编程，会总结，会画图，会解释复杂问题。可一个助手能不能长期留下，最后看的不只是它会多少，还看它能不能少让用户反复解释自己。

过去 Memory 解决的是“记住”。这次更新瞄准的是更难的一步：别记错，别记脏，别拿过去的用户误解现在的用户。

长期记忆的麻烦就在这里。

忘了，用户可以再说一遍；记错了，AI 会带着错误的熟悉感继续工作。

所以，这次更新的价值，不在 ChatGPT 多记住了几条信息，而在它开始学会整理过去。

简单说，就是少用脏记忆，多用有效记忆。

会记住，只是 Memory 的第一步。会忘，才是长期助手的入场券。

1. 长期记忆最大的问题，是会变脏

记忆听起来总是好东西。

一个助手记得用户的习惯，记得用户的项目，记得用户的偏好，记得用户反复修改过的标准，当然比每次从零开始强得多。

但长期记忆有一个麻烦：时间一长，它会变脏。

用户在对话里留下的东西，并不都适合长期保存。有些是稳定偏好，有些是临时要求；有些是正在推进的项目，有些早就结束；有些是明确判断，有些只是试探；有些当时正确，过一段时间就变成了错误上下文。

一个用户说“我下周去新加坡”，旅行结束后，这句话就不能继续当成未来计划。用户连续几天分析一家公司，项目结束后，ChatGPT 也不该每次都把这家公司当成当前重点。用户某篇文章要求“短一点”，不能推导出他以后所有文章都喜欢短文。用户某次说“正式一点”，也不能变成永久性的公文腔偏好。

这就是长期记忆真正难的地方。

存下来并不难，难的是判断这条信息现在还算不算数。

过去的 ChatGPT Memory，更容易给用户一种“它记住了”的感觉。新的问题也跟着出现：它记住的内容，有没有过期？不同记忆之间有没有冲突？某条信息该不该在当前回答里出现？

OpenAI 这次更新，真正要处理的就是这些问题。

它要让 ChatGPT 的记忆保持新鲜，减少旧信息误伤当前回答，减少互相打架的偏好，让用户正在推进的工作和长期偏好更容易被正确调用。

翻成人话，就是别让旧信息继续装成新事实，也别让几条互相打架的偏好同时指挥模型。

这听上去像细节，实际是记忆系统从保存走向治理。

保存信息，是把话放进一个地方。治理记忆，是不断判断这句话的有效期、优先级和适用场景。

长期记忆真正的难点，从来不是保存，而是清理。

对 AI 来说，Memory 不只是个性化功能，更像一套个人上下文清洗系统。越懂用户，越需要清理用户留下的旧痕迹。

一句话到底是长期偏好，还是当前任务的临时约束？它来自用户明确表达，还是系统从多轮对话里推断出来？最近有没有被再次确认？有没有和新信息冲突？现在拿出来，会帮忙还是添乱？

这些判断，才是 ChatGPT Memory 这次升级的重点。

AI 忘了你，是陌生；AI 记错你，是误解。

OpenAI 现在要解决的，正是后者。

2. 以前的 ChatGPT 会记，但还不够会整理

OpenAI 的记忆能力不是突然出现的。

最早的个性化靠 Custom Instructions。用户手动告诉 ChatGPT：自己是谁，希望它怎么回答，语气正式还是轻松，回答简洁还是详细。这个功能很有用，却像一张用户自己填写的说明书。说明书要靠人维护，偏好变了，项目变了，用户还要回来修改。

后来有了 Saved Memories。

用户可以直接说：“记住我喜欢简洁回答”“记住我正在学 Python”“记住我写文章不喜欢 AI 腔”。这些信息能够跨对话保存，ChatGPT 不必每次重新认识用户。

这一步解决了很多问题，也留下了一个新问题：它更适合保存那些明确、稳定、容易描述的信息。

真实使用中，很多重要偏好不会以“请记住”的方式出现。

一个用户可能从没正式说过“我讨厌列表排比”，只是每次看到这种写法都说“太 AI 味，改掉”。他可能也没说过“我喜欢商业评论式表达”，只是反复要求文章像商业杂志总编那样收紧、判断更清楚。封面审美也是如此。用户未必会把“不喜欢背影人物、不喜欢割裂构图”写成规则，但每次看到这种画面都会否定。

这些反馈如果不能被吸收，AI 就始终像新来的。

所以 OpenAI 后来让 ChatGPT 参考历史聊天，从长期对话里识别偏好、目标和正在推进的工作。

这一步很关键。记忆从用户主动登记，走向系统主动理解。

麻烦也随之出现。

历史对话并不干净。用户会试错，会否定，会临时改变主意，会讨论自己并不认同的观点，会推进已经结束的项目，也会对某一次任务提出只适用于当下的要求。

如果系统只是从历史里抓信息，错误记忆会越来越多。

所以 Memory 的下一步不能继续沿着“多记一点”走。它必须开始整理。

过去的问题是如何记住。

这次更新推进的问题，是如何让记忆继续有效。

这两个问题的难度完全不同。

过去 ChatGPT Memory 的体验上限，取决于它能不能记住你；这次更新之后，体验上限开始取决于它能不能维护一个不断变化的你。

3. Dreaming 像后台编辑，替 ChatGPT 整理过去

OpenAI 这次提到一个很有意思的词：Dreaming。

这个词容易让人想歪，好像模型会在睡觉时做梦。实际更接近一个后台编辑。

用户在前台不断对话，系统在后台整理长期上下文。重复的偏好要合并，过时的信息要降权，冲突的记忆要重新排序，有用的项目状态要保留下来。

下一次用户提问时，模型不用临时翻一堆历史聊天，而是可以调用一份已经整理过的状态摘要。

这一步很关键。

长期记忆一旦规模变大，直接检索历史会遇到很多麻烦。成本高，速度慢，噪音大，稳定性也差。一个人过去可能说过很多互相冲突的话。系统如果每次临时搜索，今天找到 A，明天找到 B，回答就会摇摆。

Dreaming 的价值，在于把一部分整理工作提前完成。

它像一个后台编辑，把用户过去大量对话压缩成更适合模型使用的“用户状态稿”。

比如用户过去几十次反馈：标题不够有冲突，开头要抓人，不喜欢 AI 腔，不喜欢列表堆砌，不喜欢模板化转折，章节太多要合并，希望文章更像商业杂志，不喜欢背影人物和割裂构图。

低级系统会留下很多碎片。

更好的系统会把这些碎片整理成一条稳定判断：这个用户偏好强判断、低 AI 味、商业评论式表达，也偏好整体感更强、层次更克制的视觉方案。

这才是从聊天记录到用户状态的压缩。

Dreaming 更关键的地方，是重写旧记忆之间的关系。它要把重复偏好合并，把过期计划移出当前状态，把互相冲突的要求重新排序，把低价值细节留在历史里。换句话说，它不是给历史聊天做读书笔记，而是在维护一份随时间变化的用户状态。

总结历史，是把过去讲清楚。维护记忆，是判断过去哪些部分还该参与现在。

如果用户后来改变偏好，系统要更新；某个项目结束，系统要让它淡出；当前对话有明确要求，当前要求要压过长期默认值。

长期使用一款 AI，最怕越用越乱。ChatGPT 这次更新想达到的状态，恰好相反：越用越准。

Dreaming 的价值，是让 ChatGPT 在下一次回答前，先把过去整理干净。

4. 用户的体感，是少解释、少纠错、少被过去误伤

这次更新落到用户体验上，最直接的变化是：ChatGPT 更少像一个新员工入职。

很多高频用户都有过这种体验。每次打开一个新对话，都要重新培训一次助理。写文章要重新说风格，做分析要重新说标准，改标题要重新说偏好，生成封面要重新说审美禁忌，讨论项目还要把前因后果补一遍。

偶尔用一次，这点不算什么。每天靠它工作，重复成本会非常明显。

记忆系统更强之后，ChatGPT 更容易接住长期偏好。它知道用户常用什么表达风格，知道哪些句式经常被否掉，知道用户正在推进什么工作，也知道哪些标准已经反复确认过。

这不是温情脉脉的“懂你”，而是非常现实的工作流效率。

更重要的是，它会少拿旧信息带偏新回答。高频用户真正怕的，不是 ChatGPT 偶尔忘记，而是它把一个早已变化的状态当作现在的事实。

这也会影响 ChatGPT 处理长期工作的能力。

过去，它更像单次任务工具。问一个概念，改一段文字，写一段代码，总结一份材料，都能做得不错。

真实工作没有这么干净。

写一个系列文章，要保持账号调性；研究一家公司，要积累判断框架；做一个产品，要记住前几轮取舍；学习一门技术，要知道用户学到哪里；做内容选题，要理解用户长期关注的行业和角度。

这些任务靠一次推理解决不了，需要连续上下文。

Memory 更新后，ChatGPT 更像一个长期协作者。它不只回答眼前的问题，还能更好延续之前形成的工作脉络。

这也是为什么这次更新对高频用户很重要。它提高的不是单次回答上限，而是长期协作的稳定性。

5. Gemini 知道得多，Claude 项目感强，OpenAI 抓住了对话反馈

现在几家大模型公司都在补记忆能力。Gemini 能参考过去聊天，Claude 有 Memory、chat search 和 Projects。长期记忆已经成了 AI 助手的基础设施。

只是各家的起点不一样。

Gemini 的强项是数据入口。

Google 有 Gmail、Calendar、Docs、Drive、YouTube、Search、Android、Chrome。如果这些入口全部连起来，Gemini 理论上可以拥有最完整的用户生活和工作上下文。

问题也出在这里。

Google 的挑战不是记得太少，而是可能知道得太多。数据越多，调用越危险。用户问一个普通问题，AI 突然引用邮件、日历或搜索历史，技术上很强，心理上未必舒服。

用户会本能地追问：它怎么知道？它还知道什么？我能不能控制？

所以 Gemini 面临的难题，是把庞大的个人数据变成自然、可控、不冒犯的对话记忆。

Claude 的强项是项目上下文。

Claude Projects 很适合围绕一个明确项目沉淀文档、历史对话和工作资料。它像一个优秀的项目文件夹，边界清楚，污染较少，尤其适合写代码、读长文档、做研究和处理企业材料。

项目记忆很强，它服务的是“这件事怎么做”。

ChatGPT Memory 更接近另一个问题：这个人一贯怎么做事。

真实用户的大量偏好，常常散落在日常对话里。今天改文章，明天做封面，后天研究公司，再过几天讨论产品。用户未必会先创建一个项目，再把需求放进去。很多偏好，就是在反复修改、否定和确认中长出来的。

OpenAI 的优势正在这里。

ChatGPT 未必拥有 Google 那么宽的数据入口，也未必像 Claude Projects 那样天然项目化，但它占据了用户主动表达意图的场景。用户在这里不断告诉系统：这一版为什么不对，下一版应该怎么改，哪个判断要保留，哪个表达以后别再出现。

这种反馈比搜索记录、邮件记录、日历记录更接近真实意图。

搜索记录说明用户查过什么，邮件说明用户处理过什么，日历说明用户安排过什么。对话反馈直接告诉系统：用户想把事情做成什么样，以及为什么不满意。

这对记忆系统极其宝贵。

普通用户画像回答“这个人像谁”，ChatGPT Memory 更接近回答“这个人怎么工作”。

前者是标签，后者是协作标准。

Gemini 的麻烦是知道得太多，Claude 的边界是项目感太强，OpenAI 抓住的是用户一轮轮反馈里的协作标准。

6. 护城河不在记住你，而在你舍不得重新教一遍

如果只把这次 Memory 更新看成一个个性化功能，就低估了它。

它真正指向的是下一代 AI 助手。

未来的 AI 会从回答问题走向持续办事。写作、研究、代码、行程、邮件和外部工具调用，都会被纳入同一条工作流。

一旦 AI 要替用户办事，就必须知道用户是谁、标准是什么、边界在哪里。

这些都离不开记忆。

没有长期记忆的 Agent，只能执行一次性指令；有了稳定记忆，它才可能承担连续工作。

有长期记忆的 Agent，才像真正的私人助理。它知道用户平时怎么做决定，知道哪些表达会被否掉，知道哪些事情必须谨慎，知道什么时候该追问，什么时候可以直接推进。

这就是 Memory 的战略价值。

它让 ChatGPT 从回答问题，慢慢走向持续工作。

模型负责想明白，工具负责动手干，记忆负责确认这件事到底是替谁干。

OpenAI 强化 Memory，实际是在给 Agent 铺地基。

当然，记忆越强，越考验控制权。用户要知道 ChatGPT 记了什么、为什么记、什么时候用，也要能随时改掉或删掉。临时聊天、敏感信息和当前指令，都必须有清楚优先级。否则，记忆越强，信任越脆弱。

这也是记忆系统真正难的地方：它既要让 AI 更懂用户，又不能让用户觉得被盯着。

长期助手和普通工具的差别就在这里。

普通工具只要好用。长期助手还必须可信。

到了这一步，Memory 才真正从一个功能变成系统。

AI 竞争过去总围绕模型能力展开。接下来，AI 助手之间的差距，会越来越多地体现在另一件事上：谁能长期、准确、克制地理解用户。

知道得多不够，知道得合适才重要。

这就是 OpenAI 押注 Memory 的真正原因。

模型会进步，功能会扩散，价格会下降。可一个用户和 AI 长期协作后形成的记忆关系，很难一键迁移。

用户真正带不走的，不是几条偏好，而是一次次修改后形成的默契：哪些表达会被否掉，哪些判断要保留，哪些项目已经结束，哪些标准不能降低。

真正的订阅护城河，不是用户相信 ChatGPT 永远最强，而是用户发现，换掉它又要重新教一遍。

真正的迁移成本，不是导不出几条记忆，而是带不走那些反复修改后形成的默契。

OpenAI 的新护城河，不是模型，是记忆。更准确地说，是一套能清理过去、跟上变化，并让用户懒得重新教一遍的记忆系统。

谢谢您看到了这里，如果觉得还不错，随手点个赞、在看、转发三连吧，如果想第一时间收到推送，也可以给我个星标⭐。下次见☕️。

- End -

封面海报@豆包AI

合作或投稿，请私信联系

‍推荐阅读：