本周 6 个值得关注的新 AI 工具和功能更新

最近这几天，AI 圈的更新密度又上来了。

我每天扫一遍热点的时候，有一种很强烈的感觉，就是工具层面的进化正在加速。不是那种发布会级别的噱头式更新，而是一个个实打实地在改工作流的东西。

今天挑了 6 个我觉得挺值得聊的，按照我自己的兴奋程度排了个序。

先说最让我上头的一个。

ChatGPT 这周更新了它的记忆系统，全新的架构，名字叫 Dreaming。

说实话，我之前对 ChatGPT 的记忆功能一直是半信半疑的态度。之前那个版本，你需要手动告诉它「记住我喜欢什么」，它就傻傻地存一条。用着用着就过期了，换了个话题它就忘了你是谁，跟金鱼似的。

Dreaming 这个架构，最核心的变化就一个字，自动。

它会在后台从你所有的对话历史里，自己提取、归纳、更新记忆。不需要你手动说「记住这个」，它自己就去琢磨了。你之前告诉它你的相机型号和 housing 品牌，下次聊配件的时候它会直接给你推荐兼容的方案。你说自己素食、喜欢安静的餐厅、特别在意空调温度，它会在后面的推荐里自动带上这些偏好，不用每次重复一遍。

还有个细节我觉得挺骚的，时间感知。你说「下周六有个生日派对要准备」，过了那个周六之后，它会自动把这个更新成「上周六办了生日派对」，不会再傻乎乎地继续给你推荐派对场地。

也不是没有前车之鉴。去年 Dreaming 的 V0 版本就有后台整理的概念了，但那个版本只能算手动记忆的辅助，没法独立干活。这次是真正能自己转起来的架构了。

OpenAI 说新架构的计算效率提升了 5 倍，这也是为什么 Free 用户未来几周也能用上，之前算不过来嘛，现在算得过来了。Plus 和 Pro 用户今天已经在美国区上线了。

我自己的感受是，这东西如果真的跑起来，ChatGPT 就从一个「每次都要重新认识的聊天工具」，变成了一个「真的认识你的个人助理」。这两个东西，体验上是完全不同的维度。

02 · Nex-N2-Pro — 开源推理模型杀到 GPT-5.5 级

顺着上面聊到的记忆和个性化，再聊聊另一个让我有点兴奋的东西。

硅基流动上线了一款叫 Nex-N2-Pro 的模型，基于 Qwen3.5-397B-A17B 的 MoE 架构。

397B 总参数，激活参数 17B，MoE 架构嘛，老朋友了。262K 上下文，支持多模态，这些参数看着就很有安全感。

最让我注意的是两个点。

一个是它的性能对标，GPT-5.5 和 Claude Opus 4.7 级别。我第一次看到这个的时候，说实话有点懵。开源推理模型杀到这个级别了？Terminal Bench 2.1、GDPVal、SWE-Verified 这些 benchmark 上都是榜首。智能体编码、深度搜索、工具调用是它的强项，而且兼容 Claude Code 和 Cursor 这些主流开发工具。

另一个是自适应推理深度。这玩意自动调节「思考」的深度，能减少 30-50% 的思考 token，但性能不降。我琢磨了一下这个机制，有点像人做数学题，简单的口算直接出答案，难的才在草稿纸上推导。不需要每道题都列完整的解题过程，这特么很合理。

硅基流动已经 T+0 接入了，前两周免费。我自己也还在摸索阶段，但这个配置和这个价格，确实值得一试。

03 · Codex iOS 插件 — 不装 Xcode 也能开发 App

说到 AI 编程工具，OpenAI 给 Codex 加了个新插件，Build iOS Apps。

我一直在用 Codex 做项目，之前如果要开发 iOS 应用，流程是这样的。在 Codex 里写代码，复制到 Xcode，编译运行，看效果，不满意的话回去改代码，再复制，再编译。

这个循环有多烦呢，反正每次切来切去我都有一种「为什么我要受这种罪」的感觉。

现在 Codex 直接内置了一个浏览器，能在里面实时查看和测试 iOS 应用。打开 SwiftUI 预览，改了代码立刻热重载看到效果。全程不用离开 Codex。

写代码到看效果的时间从分钟级缩短到秒级。

对专业 iOS 开发者来说可能感知没这么强，毕竟人家 Xcode 玩得溜得很。但对产品经理、独立开发者这种「想快速搞个原型看看」的人来说，这个插件是真的降低了门槛。你甚至不需要装 Xcode，在 Codex 里就能完成整个闭环。

04 · NotebookLM 来源归属 — 「它说的是真的吗」终于有答案

聊完开发工具，说个做内容和研究的朋友可能会觉得「终于来了」的更新。

NotebookLM 加了一个叫 Source Attribution 的功能，来源归属。

之前用 NotebookLM 生成内容有个很烦的问题，就是你不知道 AI 的回答到底基于哪些原文。它给你一段分析，你看着挺好的，但你没法追溯它引用的是哪篇论文的哪一段、哪个数据来自哪个出处。对于做研究或者严肃内容创作的人来说，这种「不可追溯」是一个硬伤。

现在可以看到每条生成内容背后具体引用了哪些来源了。 而且可以一键迭代调整，哪条引用不对直接改。

我自己用 NotebookLM 做深度阅读和知识整理的时候，最大的焦虑就是「它说的是真的吗」。现在至少能看到出处了，安心了不少。

05 · Ideogram v4.0 — 原生 2K + JSON 提示词

再聊个生图领域的。

Ideogram 发布了 v4.0，几个关键词，原生 2K 分辨率，文字渲染大幅提升，支持 JSON 提示词。

Ideogram 这家一直有个很鲜明的标签，就是「图片中的文字渲染」。在这之前，AI 生图里的文字基本都是鬼画符，Ideogram 是最早把这个问题解决得比较好的。

v4.0 直接原生输出 2K，不需要后期放大。 对做公众号头图、产品海报、品牌物料这些场景来说，这个分辨率是够用的。JSON 提示词的支持意味着你可以用结构化的方式精确控制生成内容，批量生产物料的时候会方便很多。

已在 Krea 平台上线了。

06 · Miso One — 一次克隆、110ms 延迟的开源语音

最后一个，开源阵营的玩家可能会感兴趣。

Miso One，8B 参数的开源语音模型。

推理延迟 110ms，接近实时。只需要一段短样本就能做语音克隆。权重已经开源到 GitHub 了，可以自托管，不需要 API Key。

110ms 这个数字什么概念呢，基本上就是正常对话的节奏了。之前开源语音模型最大的痛点就是延迟太高，聊起来你能明显感觉到那个「卡了一拍」的感觉。110ms 基本消除了这个问题。

自托管的好处就是音频数据不出本地，对隐私敏感的场景特别友好。做播客配音、有声书、给 AI Agent 加语音能力，这些都是很实际的应用场景。

本周的一个感受

回顾一下这周的这几个更新，我有一个很直观的感受。

记忆和个性化正在成为 AI 产品的核心战场。 ChatGPT 的 Dreaming 架构让 AI 从「无状态的工具」进化到「有记忆的助理」，这个跨越比我预想的要快。

开源模型继续在逼近闭源的天花板。 Nex-N2-Pro 的出现，让「GPT-5.5 级别的开源模型」变成了现实。一年前这事谁敢想。

工具链的闭环越来越紧。 Codex 的 iOS 插件、NotebookLM 的来源归属，都是在补齐「最后一公里」的体验短板。

有一本我很喜欢的书，叫《北京折叠》，里面北京被分成了三个物理空间，不同阶层的人生活在不同的空间里。而在 AI 工具领域，其实也有一种折叠正在发生。有些人已经在用 Dreaming 记忆 + Claude Code + 自托管语音模型构建自己的私人 AI 基础设施了，而有些人还在纠结 Prompt 怎么写。

这中间的信息差，正在以肉眼可见的速度拉大。

能做的还是那句话。磨平一点点信息差。哪怕只是很小很小的一点。

以上，既然看到这里了，如果觉得不错，随手点个赞、在看、转发三连吧，如果想第一时间收到推送，也可以给我个星标⭐～谢谢你看我的文章，我们，下次再见。

/ 作者：路仙Ai实践