乐于分享
好东西不私藏

2026年5月6日AI日报 | OpenAI、Google、Luma与企业级AI新进展

2026年5月6日AI日报 | OpenAI、Google、Luma与企业级AI新进展

AI日报
2026.5.6日资讯速递

1. OpenAI 推出 GPT-5.5 Instant,ChatGPT 记忆功能同步增强

OpenAI 开始向所有 ChatGPT 用户推出 GPT-5.5 Instant,作为新的默认模型替代 GPT-5.3 Instant,并在 API 中提供 gpt-5.5-chat-latest。这次更新重点提升了通用智能、事实准确性、图像分析和 STEM 解题能力,同时让输出风格更简洁直白。

  • 高风险领域内部评估中,幻觉声明较前代减少 52.5%

  • 用户标记的事实错误对话中,不准确声明减少 37.3%

  • ChatGPT 新增“记忆源”功能,用户可查看、更新和删除个性化回复的上下文来源

2. Google DeepMind 开源 Gemma 4 MTP drafter,推理速度最高提升 3 倍

Google DeepMind 为 Gemma 4 系列模型发布了 Multi-Token Prediction(MTP)drafter,通过推测解码和共享 KV cache,并行预测多个 token,在不牺牲输出质量的前提下显著提升推理速度。这一能力已覆盖 Gemma 4 全系列,并采用 Apache 2.0 协议开源。

  • 官方称最高可实现 3 倍推理加速

  • Gemma 4 26B MoE 在 Apple Silicon 上可实现约 2.2 倍本地加速

  • Hugging Face、Kaggle、vLLM 等主流框架首日支持

3. Subquadratic 推出 SubQ,上下文窗口达到 1200 万 token

Subquadratic 发布基于稀疏注意力架构的长上下文模型 SubQ,并开放早期访问。官方主打超长上下文和极高预填充速度,面向 API 调用和编码 Agent 等场景。

  • 上下文窗口达到 1200 万 token

  • 在 1M token 长度任务中,相比 FlashAttention-2 最高实现 52.2 倍预填充加速

  • 官方称成本约为其他领先模型的 1/5,并预告后续发布模型卡

4. Luma 开放 UNI-1.1 系列 API,图像模型进入生产阶段

Luma 正式开放 UNI-1.1 与 UNI-1.1-Max 的 API 访问,标志其统一智能推理模型进入生产可用阶段。该系列采用 decoder-only 自回归 Transformer 架构,可同时处理文本与图像 token。

  • API 支持图像生成与自然语言修改两类能力

  • 图像生成端点最多支持 9 张参考图

  • 在 Arena.ai 评测中,Luma 位列全球实验室第三,UNI-1.1-Max 排到文生图榜单第六

5. Google AI Studio 更新 Build 模块,接入 Nano Banana 与编辑模式

Google AI Studio 近日为 Vibe Coding 能力带来多项更新,重点是上线新的编辑模式,并集成 Nano Banana 图像生成能力。用户现在可以直接在界面上做批注、快速编辑组件,并自动替换自定义图像资产。

  • 支持在 UI 界面直接绘制、标注和选中元素进行修改

  • 生成应用时可自动创建并替换图像素材

  • 图像上传流程也被进一步简化

6. OpenClaw 发布 2026.5.4 版本,优化插件安装与 Gateway 启动

OpenClaw 发布 2026.5.4 版本,重点改善插件安装更新体验、加快 Gateway 启动速度,并修复了 Windows 与 Discord 相关稳定性问题。官方还透露计划在 5 月下旬推出长期支持版 StableClaw。

  • 更新重点包括插件流程优化、启动路径提速和诊断提示改进

  • 新增 Twilio 实时 Gemini 语音桥及模型认证查看功能

  • 长期支持版预计用于回应此前版本更新带来的性能波动

7. 豆包测试三档订阅服务,月费最高来到 500 元

豆包在 App Store 页面出现“豆包订阅”服务说明,引发市场关注。根据页面信息与媒体报道,其付费档位覆盖 68 元、200 元和 500 元三档,但官方表示相关方案仍处测试阶段。

  • 官方强调产品将继续提供免费服务

  • 当前主要是在探索更多增值服务模式

  • 具体定价和正式上线时间尚未公布

8. Codex 发布 Codex Security 插件,整合五个安全工作流

Codex 团队推出 Codex Security 安全插件,将安全审查做成一条自动化流水线。它面向代码仓库、PR 和分支的安全检查流程,强调从发现漏洞到形成攻击路径报告的完整闭环。

  • 内置安全扫描、威胁建模、漏洞发现、验证、攻击路径分析五类工作流

  • 可帮助识别权限绕过、注入攻击等常见风险

  • 目标是减少误报,并输出更接近攻击者视角的安全报告

9. LLMSearchIndex 发布本地搜索库,支持 FineWeb 与维基百科检索

LLMSearchIndex 是一款面向本地大模型和 RAG 系统的 Python 搜索库,尝试提供不依赖外部付费接口的本地互联网级检索方案。它通过自定义压缩索引,让开发者在本地就能完成大规模文本搜索。

  • 覆盖 FineWeb 数据集与维基百科的大部分网页内容

  • 完整索引体积约 2GB,可在多数普通硬件上运行

  • 适合本地模型做检索增强生成,降低外部搜索依赖

10. OpenAI 与普华永道合作,以 AI Agent 重构财务职能

OpenAI 与普华永道近期宣布合作,计划帮助企业 CFO 团队利用 AI Agent 自动化财务工作流,并提升预测与风控能力。双方已先在 OpenAI 内部财务组织验证相关方案,再逐步沉淀为面向企业的部署路径。

  • 覆盖规划、预测、报告、采购、支付、资金、税务和会计关账等财务环节

  • OpenAI 内部财务团队借助 Codex,在人员规模不变情况下将合同处理量提升至 5 倍

  • 这意味着 AI Agent 正从通用助手进一步走向企业核心经营流程

声明:本内容由AI生成,可能包含不准确或推测性信息,请读者自行甄别并谨慎参考。

欢迎点赞收藏

持续关注每日AI前沿动态
– 立即扫码 –
更多资讯,
点击下方卡片关注赛凡智云协作平台
▲ 赛凡云盒,一款超好用的企业私有云盘