2026年5月6日AI日报 | OpenAI、Google、Luma与企业级AI新进展

1. OpenAI 推出 GPT-5.5 Instant,ChatGPT 记忆功能同步增强
OpenAI 开始向所有 ChatGPT 用户推出 GPT-5.5 Instant,作为新的默认模型替代 GPT-5.3 Instant,并在 API 中提供 gpt-5.5-chat-latest。这次更新重点提升了通用智能、事实准确性、图像分析和 STEM 解题能力,同时让输出风格更简洁直白。
-
高风险领域内部评估中,幻觉声明较前代减少 52.5%
-
用户标记的事实错误对话中,不准确声明减少 37.3%
-
ChatGPT 新增“记忆源”功能,用户可查看、更新和删除个性化回复的上下文来源
2. Google DeepMind 开源 Gemma 4 MTP drafter,推理速度最高提升 3 倍
Google DeepMind 为 Gemma 4 系列模型发布了 Multi-Token Prediction(MTP)drafter,通过推测解码和共享 KV cache,并行预测多个 token,在不牺牲输出质量的前提下显著提升推理速度。这一能力已覆盖 Gemma 4 全系列,并采用 Apache 2.0 协议开源。
-
官方称最高可实现 3 倍推理加速
-
Gemma 4 26B MoE 在 Apple Silicon 上可实现约 2.2 倍本地加速
-
Hugging Face、Kaggle、vLLM 等主流框架首日支持
3. Subquadratic 推出 SubQ,上下文窗口达到 1200 万 token
Subquadratic 发布基于稀疏注意力架构的长上下文模型 SubQ,并开放早期访问。官方主打超长上下文和极高预填充速度,面向 API 调用和编码 Agent 等场景。
-
上下文窗口达到 1200 万 token
-
在 1M token 长度任务中,相比 FlashAttention-2 最高实现 52.2 倍预填充加速
-
官方称成本约为其他领先模型的 1/5,并预告后续发布模型卡
4. Luma 开放 UNI-1.1 系列 API,图像模型进入生产阶段
Luma 正式开放 UNI-1.1 与 UNI-1.1-Max 的 API 访问,标志其统一智能推理模型进入生产可用阶段。该系列采用 decoder-only 自回归 Transformer 架构,可同时处理文本与图像 token。
-
API 支持图像生成与自然语言修改两类能力
-
图像生成端点最多支持 9 张参考图
-
在 Arena.ai 评测中,Luma 位列全球实验室第三,UNI-1.1-Max 排到文生图榜单第六
5. Google AI Studio 更新 Build 模块,接入 Nano Banana 与编辑模式
Google AI Studio 近日为 Vibe Coding 能力带来多项更新,重点是上线新的编辑模式,并集成 Nano Banana 图像生成能力。用户现在可以直接在界面上做批注、快速编辑组件,并自动替换自定义图像资产。
-
支持在 UI 界面直接绘制、标注和选中元素进行修改
-
生成应用时可自动创建并替换图像素材
-
图像上传流程也被进一步简化
6. OpenClaw 发布 2026.5.4 版本,优化插件安装与 Gateway 启动
OpenClaw 发布 2026.5.4 版本,重点改善插件安装更新体验、加快 Gateway 启动速度,并修复了 Windows 与 Discord 相关稳定性问题。官方还透露计划在 5 月下旬推出长期支持版 StableClaw。
-
更新重点包括插件流程优化、启动路径提速和诊断提示改进
-
新增 Twilio 实时 Gemini 语音桥及模型认证查看功能
-
长期支持版预计用于回应此前版本更新带来的性能波动
7. 豆包测试三档订阅服务,月费最高来到 500 元
豆包在 App Store 页面出现“豆包订阅”服务说明,引发市场关注。根据页面信息与媒体报道,其付费档位覆盖 68 元、200 元和 500 元三档,但官方表示相关方案仍处测试阶段。
-
官方强调产品将继续提供免费服务
-
当前主要是在探索更多增值服务模式
-
具体定价和正式上线时间尚未公布
8. Codex 发布 Codex Security 插件,整合五个安全工作流
Codex 团队推出 Codex Security 安全插件,将安全审查做成一条自动化流水线。它面向代码仓库、PR 和分支的安全检查流程,强调从发现漏洞到形成攻击路径报告的完整闭环。
-
内置安全扫描、威胁建模、漏洞发现、验证、攻击路径分析五类工作流
-
可帮助识别权限绕过、注入攻击等常见风险
-
目标是减少误报,并输出更接近攻击者视角的安全报告
9. LLMSearchIndex 发布本地搜索库,支持 FineWeb 与维基百科检索
LLMSearchIndex 是一款面向本地大模型和 RAG 系统的 Python 搜索库,尝试提供不依赖外部付费接口的本地互联网级检索方案。它通过自定义压缩索引,让开发者在本地就能完成大规模文本搜索。
-
覆盖 FineWeb 数据集与维基百科的大部分网页内容
-
完整索引体积约 2GB,可在多数普通硬件上运行
-
适合本地模型做检索增强生成,降低外部搜索依赖
10. OpenAI 与普华永道合作,以 AI Agent 重构财务职能
OpenAI 与普华永道近期宣布合作,计划帮助企业 CFO 团队利用 AI Agent 自动化财务工作流,并提升预测与风控能力。双方已先在 OpenAI 内部财务组织验证相关方案,再逐步沉淀为面向企业的部署路径。
-
覆盖规划、预测、报告、采购、支付、资金、税务和会计关账等财务环节
-
OpenAI 内部财务团队借助 Codex,在人员规模不变情况下将合同处理量提升至 5 倍
-
这意味着 AI Agent 正从通用助手进一步走向企业核心经营流程
声明:本内容由AI生成,可能包含不准确或推测性信息,请读者自行甄别并谨慎参考。
欢迎点赞收藏


夜雨聆风