最近这几天,AI 圈的更新密度又上来了。
我每天扫一遍热点的时候,有一种很强烈的感觉,就是工具层面的进化正在加速。不是那种发布会级别的噱头式更新,而是一个个实打实地在改工作流的东西。
今天挑了 6 个我觉得挺值得聊的,按照我自己的兴奋程度排了个序。
先说最让我上头的一个。

ChatGPT 这周更新了它的记忆系统,全新的架构,名字叫 Dreaming。
说实话,我之前对 ChatGPT 的记忆功能一直是半信半疑的态度。之前那个版本,你需要手动告诉它「记住我喜欢什么」,它就傻傻地存一条。用着用着就过期了,换了个话题它就忘了你是谁,跟金鱼似的。
Dreaming 这个架构,最核心的变化就一个字,自动。
它会在后台从你所有的对话历史里,自己提取、归纳、更新记忆。不需要你手动说「记住这个」,它自己就去琢磨了。你之前告诉它你的相机型号和 housing 品牌,下次聊配件的时候它会直接给你推荐兼容的方案。你说自己素食、喜欢安静的餐厅、特别在意空调温度,它会在后面的推荐里自动带上这些偏好,不用每次重复一遍。
还有个细节我觉得挺骚的,时间感知。你说「下周六有个生日派对要准备」,过了那个周六之后,它会自动把这个更新成「上周六办了生日派对」,不会再傻乎乎地继续给你推荐派对场地。
也不是没有前车之鉴。去年 Dreaming 的 V0 版本就有后台整理的概念了,但那个版本只能算手动记忆的辅助,没法独立干活。这次是真正能自己转起来的架构了。
OpenAI 说新架构的计算效率提升了 5 倍,这也是为什么 Free 用户未来几周也能用上,之前算不过来嘛,现在算得过来了。Plus 和 Pro 用户今天已经在美国区上线了。
我自己的感受是,这东西如果真的跑起来,ChatGPT 就从一个「每次都要重新认识的聊天工具」,变成了一个「真的认识你的个人助理」。这两个东西,体验上是完全不同的维度。
02 · Nex-N2-Pro — 开源推理模型杀到 GPT-5.5 级

顺着上面聊到的记忆和个性化,再聊聊另一个让我有点兴奋的东西。
硅基流动上线了一款叫 Nex-N2-Pro 的模型,基于 Qwen3.5-397B-A17B 的 MoE 架构。
397B 总参数,激活参数 17B,MoE 架构嘛,老朋友了。262K 上下文,支持多模态,这些参数看着就很有安全感。
最让我注意的是两个点。
一个是它的性能对标,GPT-5.5 和 Claude Opus 4.7 级别。我第一次看到这个的时候,说实话有点懵。开源推理模型杀到这个级别了?Terminal Bench 2.1、GDPVal、SWE-Verified 这些 benchmark 上都是榜首。智能体编码、深度搜索、工具调用是它的强项,而且兼容 Claude Code 和 Cursor 这些主流开发工具。
另一个是自适应推理深度。这玩意自动调节「思考」的深度,能减少 30-50% 的思考 token,但性能不降。我琢磨了一下这个机制,有点像人做数学题,简单的口算直接出答案,难的才在草稿纸上推导。不需要每道题都列完整的解题过程,这特么很合理。
硅基流动已经 T+0 接入了,前两周免费。我自己也还在摸索阶段,但这个配置和这个价格,确实值得一试。
03 · Codex iOS 插件 — 不装 Xcode 也能开发 App

说到 AI 编程工具,OpenAI 给 Codex 加了个新插件,Build iOS Apps。
我一直在用 Codex 做项目,之前如果要开发 iOS 应用,流程是这样的。在 Codex 里写代码,复制到 Xcode,编译运行,看效果,不满意的话回去改代码,再复制,再编译。
这个循环有多烦呢,反正每次切来切去我都有一种「为什么我要受这种罪」的感觉。
现在 Codex 直接内置了一个浏览器,能在里面实时查看和测试 iOS 应用。打开 SwiftUI 预览,改了代码立刻热重载看到效果。全程不用离开 Codex。
写代码到看效果的时间从分钟级缩短到秒级。
对专业 iOS 开发者来说可能感知没这么强,毕竟人家 Xcode 玩得溜得很。但对产品经理、独立开发者这种「想快速搞个原型看看」的人来说,这个插件是真的降低了门槛。你甚至不需要装 Xcode,在 Codex 里就能完成整个闭环。
04 · NotebookLM 来源归属 — 「它说的是真的吗」终于有答案

聊完开发工具,说个做内容和研究的朋友可能会觉得「终于来了」的更新。
NotebookLM 加了一个叫 Source Attribution 的功能,来源归属。
之前用 NotebookLM 生成内容有个很烦的问题,就是你不知道 AI 的回答到底基于哪些原文。它给你一段分析,你看着挺好的,但你没法追溯它引用的是哪篇论文的哪一段、哪个数据来自哪个出处。对于做研究或者严肃内容创作的人来说,这种「不可追溯」是一个硬伤。
现在可以看到每条生成内容背后具体引用了哪些来源了。 而且可以一键迭代调整,哪条引用不对直接改。
我自己用 NotebookLM 做深度阅读和知识整理的时候,最大的焦虑就是「它说的是真的吗」。现在至少能看到出处了,安心了不少。
05 · Ideogram v4.0 — 原生 2K + JSON 提示词

再聊个生图领域的。
Ideogram 发布了 v4.0,几个关键词,原生 2K 分辨率,文字渲染大幅提升,支持 JSON 提示词。
Ideogram 这家一直有个很鲜明的标签,就是「图片中的文字渲染」。在这之前,AI 生图里的文字基本都是鬼画符,Ideogram 是最早把这个问题解决得比较好的。
v4.0 直接原生输出 2K,不需要后期放大。 对做公众号头图、产品海报、品牌物料这些场景来说,这个分辨率是够用的。JSON 提示词的支持意味着你可以用结构化的方式精确控制生成内容,批量生产物料的时候会方便很多。
已在 Krea 平台上线了。
06 · Miso One — 一次克隆、110ms 延迟的开源语音

最后一个,开源阵营的玩家可能会感兴趣。
Miso One,8B 参数的开源语音模型。
推理延迟 110ms,接近实时。只需要一段短样本就能做语音克隆。权重已经开源到 GitHub 了,可以自托管,不需要 API Key。
110ms 这个数字什么概念呢,基本上就是正常对话的节奏了。之前开源语音模型最大的痛点就是延迟太高,聊起来你能明显感觉到那个「卡了一拍」的感觉。110ms 基本消除了这个问题。
自托管的好处就是音频数据不出本地,对隐私敏感的场景特别友好。做播客配音、有声书、给 AI Agent 加语音能力,这些都是很实际的应用场景。
本周的一个感受
回顾一下这周的这几个更新,我有一个很直观的感受。
记忆和个性化正在成为 AI 产品的核心战场。 ChatGPT 的 Dreaming 架构让 AI 从「无状态的工具」进化到「有记忆的助理」,这个跨越比我预想的要快。
开源模型继续在逼近闭源的天花板。 Nex-N2-Pro 的出现,让「GPT-5.5 级别的开源模型」变成了现实。一年前这事谁敢想。
工具链的闭环越来越紧。 Codex 的 iOS 插件、NotebookLM 的来源归属,都是在补齐「最后一公里」的体验短板。
有一本我很喜欢的书,叫《北京折叠》,里面北京被分成了三个物理空间,不同阶层的人生活在不同的空间里。而在 AI 工具领域,其实也有一种折叠正在发生。有些人已经在用 Dreaming 记忆 + Claude Code + 自托管语音模型构建自己的私人 AI 基础设施了,而有些人还在纠结 Prompt 怎么写。
这中间的信息差,正在以肉眼可见的速度拉大。
能做的还是那句话。磨平一点点信息差。哪怕只是很小很小的一点。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。
/ 作者:路仙Ai实践
夜雨聆风