2026年5月6日AI日报 | OpenAI、Google、Luma与企业级AI新进展-夜雨聆风

2026年5月6日AI日报 | OpenAI、Google、Luma与企业级AI新进展

AI日报

2026.5.6日资讯速递

1. OpenAI 推出 GPT-5.5 Instant，ChatGPT 记忆功能同步增强

OpenAI 开始向所有 ChatGPT 用户推出 GPT-5.5 Instant，作为新的默认模型替代 GPT-5.3 Instant，并在 API 中提供 gpt-5.5-chat-latest。这次更新重点提升了通用智能、事实准确性、图像分析和 STEM 解题能力，同时让输出风格更简洁直白。

高风险领域内部评估中，幻觉声明较前代减少 52.5%
用户标记的事实错误对话中，不准确声明减少 37.3%
ChatGPT 新增“记忆源”功能，用户可查看、更新和删除个性化回复的上下文来源

2. Google DeepMind 开源 Gemma 4 MTP drafter，推理速度最高提升 3 倍

Google DeepMind 为 Gemma 4 系列模型发布了 Multi-Token Prediction（MTP）drafter，通过推测解码和共享 KV cache，并行预测多个 token，在不牺牲输出质量的前提下显著提升推理速度。这一能力已覆盖 Gemma 4 全系列，并采用 Apache 2.0 协议开源。

官方称最高可实现 3 倍推理加速
Gemma 4 26B MoE 在 Apple Silicon 上可实现约 2.2 倍本地加速
Hugging Face、Kaggle、vLLM 等主流框架首日支持

3. Subquadratic 推出 SubQ，上下文窗口达到 1200 万 token

Subquadratic 发布基于稀疏注意力架构的长上下文模型 SubQ，并开放早期访问。官方主打超长上下文和极高预填充速度，面向 API 调用和编码 Agent 等场景。

上下文窗口达到 1200 万 token
在 1M token 长度任务中，相比 FlashAttention-2 最高实现 52.2 倍预填充加速
官方称成本约为其他领先模型的 1/5，并预告后续发布模型卡

4. Luma 开放 UNI-1.1 系列 API，图像模型进入生产阶段

Luma 正式开放 UNI-1.1 与 UNI-1.1-Max 的 API 访问，标志其统一智能推理模型进入生产可用阶段。该系列采用 decoder-only 自回归 Transformer 架构，可同时处理文本与图像 token。

API 支持图像生成与自然语言修改两类能力
图像生成端点最多支持 9 张参考图
在 Arena.ai 评测中，Luma 位列全球实验室第三，UNI-1.1-Max 排到文生图榜单第六

5. Google AI Studio 更新 Build 模块，接入 Nano Banana 与编辑模式

Google AI Studio 近日为 Vibe Coding 能力带来多项更新，重点是上线新的编辑模式，并集成 Nano Banana 图像生成能力。用户现在可以直接在界面上做批注、快速编辑组件，并自动替换自定义图像资产。

支持在 UI 界面直接绘制、标注和选中元素进行修改
生成应用时可自动创建并替换图像素材
图像上传流程也被进一步简化

6. OpenClaw 发布 2026.5.4 版本，优化插件安装与 Gateway 启动

OpenClaw 发布 2026.5.4 版本，重点改善插件安装更新体验、加快 Gateway 启动速度，并修复了 Windows 与 Discord 相关稳定性问题。官方还透露计划在 5 月下旬推出长期支持版 StableClaw。

更新重点包括插件流程优化、启动路径提速和诊断提示改进
新增 Twilio 实时 Gemini 语音桥及模型认证查看功能
长期支持版预计用于回应此前版本更新带来的性能波动

7. 豆包测试三档订阅服务，月费最高来到 500 元

豆包在 App Store 页面出现“豆包订阅”服务说明，引发市场关注。根据页面信息与媒体报道，其付费档位覆盖 68 元、200 元和 500 元三档，但官方表示相关方案仍处测试阶段。

官方强调产品将继续提供免费服务
当前主要是在探索更多增值服务模式
具体定价和正式上线时间尚未公布

8. Codex 发布 Codex Security 插件，整合五个安全工作流

Codex 团队推出 Codex Security 安全插件，将安全审查做成一条自动化流水线。它面向代码仓库、PR 和分支的安全检查流程，强调从发现漏洞到形成攻击路径报告的完整闭环。

内置安全扫描、威胁建模、漏洞发现、验证、攻击路径分析五类工作流
可帮助识别权限绕过、注入攻击等常见风险
目标是减少误报，并输出更接近攻击者视角的安全报告

9. LLMSearchIndex 发布本地搜索库，支持 FineWeb 与维基百科检索

LLMSearchIndex 是一款面向本地大模型和 RAG 系统的 Python 搜索库，尝试提供不依赖外部付费接口的本地互联网级检索方案。它通过自定义压缩索引，让开发者在本地就能完成大规模文本搜索。

覆盖 FineWeb 数据集与维基百科的大部分网页内容
完整索引体积约 2GB，可在多数普通硬件上运行
适合本地模型做检索增强生成，降低外部搜索依赖

10. OpenAI 与普华永道合作，以 AI Agent 重构财务职能

OpenAI 与普华永道近期宣布合作，计划帮助企业 CFO 团队利用 AI Agent 自动化财务工作流，并提升预测与风控能力。双方已先在 OpenAI 内部财务组织验证相关方案，再逐步沉淀为面向企业的部署路径。

覆盖规划、预测、报告、采购、支付、资金、税务和会计关账等财务环节
OpenAI 内部财务团队借助 Codex，在人员规模不变情况下将合同处理量提升至 5 倍
这意味着 AI Agent 正从通用助手进一步走向企业核心经营流程

声明：本内容由AI生成，可能包含不准确或推测性信息，请读者自行甄别并谨慎参考。

欢迎点赞收藏

持续关注每日AI前沿动态

– 立即扫码 –

更多资讯，

点击下方卡片关注赛凡智云协作平台

▲ 赛凡云盒，一款超好用的企业私有云盘