

ChatGPT 最近最重要的变化,看起来一点也不性感。
没有新模型,没有跑分屠榜,也没有足够刷屏的视频演示。OpenAI 更新的是 Memory:让 ChatGPT 更好地保持上下文更新,减少过时和互相矛盾的记忆,更准确地理解用户偏好、目标和正在推进的工作。
放在发布会上,这句话大概很难赢得掌声。
高频用户却最先感受到这种变化。因为他们真正痛苦的,从来不是 ChatGPT 不会回答,而是每次都要重新解释自己。
AI 最早让人惊讶,是因为它“会”。会写,会算,会编程,会总结,会画图,会解释复杂问题。可一个助手能不能长期留下,最后看的不只是它会多少,还看它能不能少让用户反复解释自己。
过去 Memory 解决的是“记住”。这次更新瞄准的是更难的一步:别记错,别记脏,别拿过去的用户误解现在的用户。
长期记忆的麻烦就在这里。
忘了,用户可以再说一遍;记错了,AI 会带着错误的熟悉感继续工作。
所以,这次更新的价值,不在 ChatGPT 多记住了几条信息,而在它开始学会整理过去。
简单说,就是少用脏记忆,多用有效记忆。
会记住,只是 Memory 的第一步。会忘,才是长期助手的入场券。

1. 长期记忆最大的问题,是会变脏
记忆听起来总是好东西。
一个助手记得用户的习惯,记得用户的项目,记得用户的偏好,记得用户反复修改过的标准,当然比每次从零开始强得多。
但长期记忆有一个麻烦:时间一长,它会变脏。
用户在对话里留下的东西,并不都适合长期保存。有些是稳定偏好,有些是临时要求;有些是正在推进的项目,有些早就结束;有些是明确判断,有些只是试探;有些当时正确,过一段时间就变成了错误上下文。
一个用户说“我下周去新加坡”,旅行结束后,这句话就不能继续当成未来计划。用户连续几天分析一家公司,项目结束后,ChatGPT 也不该每次都把这家公司当成当前重点。用户某篇文章要求“短一点”,不能推导出他以后所有文章都喜欢短文。用户某次说“正式一点”,也不能变成永久性的公文腔偏好。
这就是长期记忆真正难的地方。
存下来并不难,难的是判断这条信息现在还算不算数。
过去的 ChatGPT Memory,更容易给用户一种“它记住了”的感觉。新的问题也跟着出现:它记住的内容,有没有过期?不同记忆之间有没有冲突?某条信息该不该在当前回答里出现?
OpenAI 这次更新,真正要处理的就是这些问题。
它要让 ChatGPT 的记忆保持新鲜,减少旧信息误伤当前回答,减少互相打架的偏好,让用户正在推进的工作和长期偏好更容易被正确调用。
翻成人话,就是别让旧信息继续装成新事实,也别让几条互相打架的偏好同时指挥模型。
这听上去像细节,实际是记忆系统从保存走向治理。
保存信息,是把话放进一个地方。治理记忆,是不断判断这句话的有效期、优先级和适用场景。
长期记忆真正的难点,从来不是保存,而是清理。
对 AI 来说,Memory 不只是个性化功能,更像一套个人上下文清洗系统。越懂用户,越需要清理用户留下的旧痕迹。
一句话到底是长期偏好,还是当前任务的临时约束?它来自用户明确表达,还是系统从多轮对话里推断出来?最近有没有被再次确认?有没有和新信息冲突?现在拿出来,会帮忙还是添乱?
这些判断,才是 ChatGPT Memory 这次升级的重点。
AI 忘了你,是陌生;AI 记错你,是误解。
OpenAI 现在要解决的,正是后者。
2. 以前的 ChatGPT 会记,但还不够会整理
OpenAI 的记忆能力不是突然出现的。
最早的个性化靠 Custom Instructions。用户手动告诉 ChatGPT:自己是谁,希望它怎么回答,语气正式还是轻松,回答简洁还是详细。这个功能很有用,却像一张用户自己填写的说明书。说明书要靠人维护,偏好变了,项目变了,用户还要回来修改。
后来有了 Saved Memories。
用户可以直接说:“记住我喜欢简洁回答”“记住我正在学 Python”“记住我写文章不喜欢 AI 腔”。这些信息能够跨对话保存,ChatGPT 不必每次重新认识用户。
这一步解决了很多问题,也留下了一个新问题:它更适合保存那些明确、稳定、容易描述的信息。
真实使用中,很多重要偏好不会以“请记住”的方式出现。
一个用户可能从没正式说过“我讨厌列表排比”,只是每次看到这种写法都说“太 AI 味,改掉”。他可能也没说过“我喜欢商业评论式表达”,只是反复要求文章像商业杂志总编那样收紧、判断更清楚。封面审美也是如此。用户未必会把“不喜欢背影人物、不喜欢割裂构图”写成规则,但每次看到这种画面都会否定。
这些反馈如果不能被吸收,AI 就始终像新来的。
所以 OpenAI 后来让 ChatGPT 参考历史聊天,从长期对话里识别偏好、目标和正在推进的工作。
这一步很关键。记忆从用户主动登记,走向系统主动理解。
麻烦也随之出现。
历史对话并不干净。用户会试错,会否定,会临时改变主意,会讨论自己并不认同的观点,会推进已经结束的项目,也会对某一次任务提出只适用于当下的要求。
如果系统只是从历史里抓信息,错误记忆会越来越多。
所以 Memory 的下一步不能继续沿着“多记一点”走。它必须开始整理。
过去的问题是如何记住。
这次更新推进的问题,是如何让记忆继续有效。
这两个问题的难度完全不同。
过去 ChatGPT Memory 的体验上限,取决于它能不能记住你;这次更新之后,体验上限开始取决于它能不能维护一个不断变化的你。
3. Dreaming 像后台编辑,替 ChatGPT 整理过去
OpenAI 这次提到一个很有意思的词:Dreaming。
这个词容易让人想歪,好像模型会在睡觉时做梦。实际更接近一个后台编辑。
用户在前台不断对话,系统在后台整理长期上下文。重复的偏好要合并,过时的信息要降权,冲突的记忆要重新排序,有用的项目状态要保留下来。
下一次用户提问时,模型不用临时翻一堆历史聊天,而是可以调用一份已经整理过的状态摘要。
这一步很关键。
长期记忆一旦规模变大,直接检索历史会遇到很多麻烦。成本高,速度慢,噪音大,稳定性也差。一个人过去可能说过很多互相冲突的话。系统如果每次临时搜索,今天找到 A,明天找到 B,回答就会摇摆。
Dreaming 的价值,在于把一部分整理工作提前完成。
它像一个后台编辑,把用户过去大量对话压缩成更适合模型使用的“用户状态稿”。
比如用户过去几十次反馈:标题不够有冲突,开头要抓人,不喜欢 AI 腔,不喜欢列表堆砌,不喜欢模板化转折,章节太多要合并,希望文章更像商业杂志,不喜欢背影人物和割裂构图。
低级系统会留下很多碎片。
更好的系统会把这些碎片整理成一条稳定判断:这个用户偏好强判断、低 AI 味、商业评论式表达,也偏好整体感更强、层次更克制的视觉方案。
这才是从聊天记录到用户状态的压缩。
Dreaming 更关键的地方,是重写旧记忆之间的关系。它要把重复偏好合并,把过期计划移出当前状态,把互相冲突的要求重新排序,把低价值细节留在历史里。换句话说,它不是给历史聊天做读书笔记,而是在维护一份随时间变化的用户状态。
总结历史,是把过去讲清楚。维护记忆,是判断过去哪些部分还该参与现在。
如果用户后来改变偏好,系统要更新;某个项目结束,系统要让它淡出;当前对话有明确要求,当前要求要压过长期默认值。
长期使用一款 AI,最怕越用越乱。ChatGPT 这次更新想达到的状态,恰好相反:越用越准。
Dreaming 的价值,是让 ChatGPT 在下一次回答前,先把过去整理干净。
4. 用户的体感,是少解释、少纠错、少被过去误伤
这次更新落到用户体验上,最直接的变化是:ChatGPT 更少像一个新员工入职。
很多高频用户都有过这种体验。每次打开一个新对话,都要重新培训一次助理。写文章要重新说风格,做分析要重新说标准,改标题要重新说偏好,生成封面要重新说审美禁忌,讨论项目还要把前因后果补一遍。
偶尔用一次,这点不算什么。每天靠它工作,重复成本会非常明显。
记忆系统更强之后,ChatGPT 更容易接住长期偏好。它知道用户常用什么表达风格,知道哪些句式经常被否掉,知道用户正在推进什么工作,也知道哪些标准已经反复确认过。
这不是温情脉脉的“懂你”,而是非常现实的工作流效率。
更重要的是,它会少拿旧信息带偏新回答。高频用户真正怕的,不是 ChatGPT 偶尔忘记,而是它把一个早已变化的状态当作现在的事实。
这也会影响 ChatGPT 处理长期工作的能力。
过去,它更像单次任务工具。问一个概念,改一段文字,写一段代码,总结一份材料,都能做得不错。
真实工作没有这么干净。
写一个系列文章,要保持账号调性;研究一家公司,要积累判断框架;做一个产品,要记住前几轮取舍;学习一门技术,要知道用户学到哪里;做内容选题,要理解用户长期关注的行业和角度。
这些任务靠一次推理解决不了,需要连续上下文。
Memory 更新后,ChatGPT 更像一个长期协作者。它不只回答眼前的问题,还能更好延续之前形成的工作脉络。
这也是为什么这次更新对高频用户很重要。它提高的不是单次回答上限,而是长期协作的稳定性。
5. Gemini 知道得多,Claude 项目感强,OpenAI 抓住了对话反馈
现在几家大模型公司都在补记忆能力。Gemini 能参考过去聊天,Claude 有 Memory、chat search 和 Projects。长期记忆已经成了 AI 助手的基础设施。
只是各家的起点不一样。
Gemini 的强项是数据入口。
Google 有 Gmail、Calendar、Docs、Drive、YouTube、Search、Android、Chrome。如果这些入口全部连起来,Gemini 理论上可以拥有最完整的用户生活和工作上下文。
问题也出在这里。
Google 的挑战不是记得太少,而是可能知道得太多。数据越多,调用越危险。用户问一个普通问题,AI 突然引用邮件、日历或搜索历史,技术上很强,心理上未必舒服。
用户会本能地追问:它怎么知道?它还知道什么?我能不能控制?
所以 Gemini 面临的难题,是把庞大的个人数据变成自然、可控、不冒犯的对话记忆。
Claude 的强项是项目上下文。
Claude Projects 很适合围绕一个明确项目沉淀文档、历史对话和工作资料。它像一个优秀的项目文件夹,边界清楚,污染较少,尤其适合写代码、读长文档、做研究和处理企业材料。
项目记忆很强,它服务的是“这件事怎么做”。
ChatGPT Memory 更接近另一个问题:这个人一贯怎么做事。
真实用户的大量偏好,常常散落在日常对话里。今天改文章,明天做封面,后天研究公司,再过几天讨论产品。用户未必会先创建一个项目,再把需求放进去。很多偏好,就是在反复修改、否定和确认中长出来的。
OpenAI 的优势正在这里。
ChatGPT 未必拥有 Google 那么宽的数据入口,也未必像 Claude Projects 那样天然项目化,但它占据了用户主动表达意图的场景。用户在这里不断告诉系统:这一版为什么不对,下一版应该怎么改,哪个判断要保留,哪个表达以后别再出现。
这种反馈比搜索记录、邮件记录、日历记录更接近真实意图。
搜索记录说明用户查过什么,邮件说明用户处理过什么,日历说明用户安排过什么。对话反馈直接告诉系统:用户想把事情做成什么样,以及为什么不满意。
这对记忆系统极其宝贵。
普通用户画像回答“这个人像谁”,ChatGPT Memory 更接近回答“这个人怎么工作”。
前者是标签,后者是协作标准。
Gemini 的麻烦是知道得太多,Claude 的边界是项目感太强,OpenAI 抓住的是用户一轮轮反馈里的协作标准。
6. 护城河不在记住你,而在你舍不得重新教一遍
如果只把这次 Memory 更新看成一个个性化功能,就低估了它。
它真正指向的是下一代 AI 助手。
未来的 AI 会从回答问题走向持续办事。写作、研究、代码、行程、邮件和外部工具调用,都会被纳入同一条工作流。
一旦 AI 要替用户办事,就必须知道用户是谁、标准是什么、边界在哪里。
这些都离不开记忆。
没有长期记忆的 Agent,只能执行一次性指令;有了稳定记忆,它才可能承担连续工作。
有长期记忆的 Agent,才像真正的私人助理。它知道用户平时怎么做决定,知道哪些表达会被否掉,知道哪些事情必须谨慎,知道什么时候该追问,什么时候可以直接推进。
这就是 Memory 的战略价值。
它让 ChatGPT 从回答问题,慢慢走向持续工作。
模型负责想明白,工具负责动手干,记忆负责确认这件事到底是替谁干。
OpenAI 强化 Memory,实际是在给 Agent 铺地基。
当然,记忆越强,越考验控制权。用户要知道 ChatGPT 记了什么、为什么记、什么时候用,也要能随时改掉或删掉。临时聊天、敏感信息和当前指令,都必须有清楚优先级。否则,记忆越强,信任越脆弱。
这也是记忆系统真正难的地方:它既要让 AI 更懂用户,又不能让用户觉得被盯着。
长期助手和普通工具的差别就在这里。
普通工具只要好用。长期助手还必须可信。
到了这一步,Memory 才真正从一个功能变成系统。
AI 竞争过去总围绕模型能力展开。接下来,AI 助手之间的差距,会越来越多地体现在另一件事上:谁能长期、准确、克制地理解用户。
知道得多不够,知道得合适才重要。
这就是 OpenAI 押注 Memory 的真正原因。
模型会进步,功能会扩散,价格会下降。可一个用户和 AI 长期协作后形成的记忆关系,很难一键迁移。
用户真正带不走的,不是几条偏好,而是一次次修改后形成的默契:哪些表达会被否掉,哪些判断要保留,哪些项目已经结束,哪些标准不能降低。
真正的订阅护城河,不是用户相信 ChatGPT 永远最强,而是用户发现,换掉它又要重新教一遍。
真正的迁移成本,不是导不出几条记忆,而是带不走那些反复修改后形成的默契。
OpenAI 的新护城河,不是模型,是记忆。更准确地说,是一套能清理过去、跟上变化,并让用户懒得重新教一遍的记忆系统。
谢谢您看到了这里,如果觉得还不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐。下次见☕️。

夜雨聆风