【速览】AI 早报 2026-05-09

AI 早报 2026-05-09

概览

模型发布

蚂蚁百灵发布 Ring-2.6-1T，OpenRouter 免费试用一周 #1
智谱发布 GLM-5V-Turbo 报告，开放Coding Plan用户申请使用 #2
商汤科技推出SenseNova 6.7 Flash-Lite #3
阶跃星辰发布 StepAudio 2.5 Realtime 实时语音大模型 #4
AI2 发布 EMO 模型，实现混合专家语义模块化 #5
千问团队开源 WebWorld 世界模型面向 Web Agent 训练 #6

开发生态

OpenClaw 发布 2026.5.7 版，强化权限与更新流程 #7
AWS 发布 Agent Toolkit for AWS 工具集 #8
Kiro 首次付费奖励 20 美元等值积分 #9

产品应用

Grok 连接器功能正式上线安卓 iOS 及网页端 #10
Google Health Coach 结束预览面向全球上线 #11

技术与洞察

Anthropic 发文阐述消除 Claude 的 agentic misalignment 行为 #12
MiniMax 修复 M2 模型稀疏 Token 遗忘及小语种混杂问题 #13
Google DeepMind 发布 AI Co-Mathematician #14
阿里巴巴提出 CDM 框架，四步推理实现图像生成最优 #15
Claude Code团队成员发文主张 HTML 替代 Markdown 作为 Agent 输出格式 #16
Nathan Lambert发文总结其中国AI实验室之行 #17

行业动态

DeepSeek 网页与 API 服务发生短时间大规模中断 #18
Anthropic 一季度营收增 80 倍，Mythos 能力遭质疑 #19
Cloudflare 裁减 1100 人适应 AI Agent 时代重构组织 #20
NVIDIA 与 IREN 合作，将部署 5 吉瓦 AI 基础设施涉 21 亿美元投资 #21
三部门印发智能体规范意见，明确 19 个典型应用场景 #22

前瞻与传闻

DeepSeek 传筹备 500 亿融资，6 月发布 V4.1 模型 #23
阶跃星辰传完成 25 亿美元融资，加速筹备赴港上市 #24

蚂蚁百灵发布 Ring-2.6-1T，OpenRouter 免费试用一周 `#1`

蚂蚁百灵团队发布万亿参数旗舰思维模型 Ring-2.6-1T。该模型基于 63B 活跃参数，专为真实世界 Agent 工作流优化。它具有自适应推理努力机制，在多项基准测试中成绩领先。该模型目前已在 OpenRouter 和 Kilo Code 等平台开放一周免费试用。

https://x.com/AntLingAGI/status/2052808934390661134
https://openrouter.ai/inclusionai/ring-2.6-1t:free

智谱发布 GLM-5V-Turbo 报告，开放Coding Plan用户申请使用 `#2`

智谱AI发布了GLM-5V-Turbo多模态基座模型的技术报告。并向GLM Coding Plan用户开放该模型的体验申请。

https://zhipu-ai.feishu.cn/share/base/form/shrcndgpmRlJoD5rMmIavUrPwzg
https://mp.weixin.qq.com/s/7mkpCpz2M2ozkaM8Vfn2Pg

商汤科技推出SenseNova 6.7 Flash-Lite `#3`

商汤科技推出轻量化多模态智能体模型SenseNova 6.7 Flash-Lite。它取消视觉转文本中间层，能直接看懂复杂图表，实现感知到行动一体化。用户可通过办公小浣熊免费体验该模型。

https://mp.weixin.qq.com/s/n5CZvuoHfjDsIPDmN0g6tA
https://github.com/OpenSenseNova/SenseNova6.7

阶跃星辰发布 StepAudio 2.5 Realtime 实时语音大模型 `#4`

阶跃星辰推出端到端实时语音大模型 StepAudio 2.5 Realtime。该模型主打中英文“活人感”对话，能精准捕捉轻笑等副语言细节并动态调整回应。该模型已在Step Plan等渠道全量上线。

https://stepaudiollm.github.io/step-audio-2.5-realtime/
https://platform.stepfun.com/docs/zh/guides/models/stepaudio-2.5-realtime

AI2 发布 EMO 模型，实现混合专家语义模块化 `#5`

AI2 发布全新的端到端预训练混合专家模型 EMO。它打破 Token 独立路由的惯例，利用文档边界作弱监督。促使 expert 按新闻、健康等语义领域自发形成模块，让模型能高效调用专家子集。

https://allenai.org/blog/emo
https://github.com/allenai/EMO
https://huggingface.co/collections/allenai/emo

千问团队开源 WebWorld 世界模型面向 Web Agent 训练 `#6`

Qwen团队开源了WebWorld大型开放网络世界模型系列。该系列包含基于 Qwen3 微调的 8B、14B 和 32B 三个版本。模型基于百万条真实网页轨迹训练，专供 Web Agent 的训练与评估使用。

https://github.com/QwenLM/WebWorld
https://huggingface.co/Qwen/WebWorld-8B

OpenClaw 发布 2026.5.7 版，强化权限与更新流程 `#7`

OpenClaw 发布 2026.5.7 版本。新版本强化了原生命令与 Active Memory 权限管控。同时优化了 CLI 工具及插件 npm 更新流程。

https://x.com/openclaw/status/2052508303687651717

AWS 发布 Agent Toolkit for AWS 工具集 `#8`

AWS 发布了 Agent Toolkit for AWS 工具集。它整合 MCP 服务器、技能与插件，能辅助 Claude Code 等编程 Agent 在 AWS 上构建应用。

https://github.com/aws/agent-toolkit-for-aws
https://docs.aws.amazon.com/agent-toolkit/latest/userguide/

Kiro 首次付费奖励 20 美元等值积分 `#9`

Kiro推出升级奖励。通过社交登录或 Builder ID 首次升级至任意付费计划的用户，绑定信用卡后，可获得价值 20 美元的 1000 积分额度。

https://kiro.dev/blog/new-paid-tier-bonus/

Grok 连接器功能正式上线安卓 iOS 及网页端 `#10`

Grok宣布连接器功能已在安卓、iOS及网页端上线，所有订阅用户均可使用。

https://x.com/grok/status/2052782088181727613

Google Health Coach 结束预览面向全球上线 `#11`

谷歌宣布基于 Gemini 模型的 AI 健康教练 Google Health Coach 正式上线。该服务率先面向 Fitbit 与 Pixel Watch 用户推出。Google AI Pro 与 Ultra 用户可免费使用。

https://blog.google/products-and-platforms/products/google-health/google-health-coach/
https://research.google/blog/how-we-are-building-the-personal-health-coach/

Anthropic 发文阐述消除 Claude 的 agentic misalignment 行为 `#12`

Anthropic 发布一项题为“Teaching Claude why”的研究，详细阐述了其如何消除 Claude 模型中的 agentic misalignment 行为。研究发现，仅通过行为示范进行训练效果有限，而教导模型深刻理解伦理原则能带来更根本的改善。

https://www.anthropic.com/research/teaching-claude-why
https://www-cdn.anthropic.com/bf10f64990cfda0ba858290be7b8cc6317685f47.pdf

MiniMax 修复 M2 模型稀疏 Token 遗忘及小语种混杂问题 `#13`

MiniMax团队成员在知乎发布分析，解释 M2 系列模型无法生成 马嘉祺 等低频词的问题。这源于后训练数据分布不均，导致低频 Token 在输出层发生表征漂移。官方通过混入覆盖全词表的合成数据进行修复，成功解决了词汇遗忘问题，并将日语等小语种混淆率降至 百分之 1。

https://www.zhihu.com/question/undefined/answer/2036149386116342692

Google DeepMind 发布 AI Co-Mathematician `#14`

Google DeepMind 发布 AI Co-Mathematician 多 Agent 工作台，辅助数学家进行定理证明与理论构建，并在 FrontierMath Tier 4 测试中以 48% 的得分创下新高。同时，Alex Imas 出任该部门 AGI 经济学总监，研究前沿 AI 对经济与工作形态的重塑。

https://x.com/pushmeet/status/2052812585804685322
https://arxiv.org/abs/2605.06651
https://x.com/alexolegimas/status/2052778908882174302

阿里巴巴提出 CDM 框架，四步推理实现图像生成最优 `#15`

阿里巴巴联合高校团队提出“连续时间分布匹配”CDM框架，将扩散模型的蒸馏从离散锚点推向连续时间优化。该方案仅需4 步推理即可实现 SOTA级图像生成质量。

https://byliutao.github.io/cdm_page/
https://arxiv.org/abs/2605.06376

Claude Code团队成员发文主张 HTML 替代 Markdown 作为 Agent 输出格式 `#16`

Claude Code团队成员发文，主张用HTML替代Markdown作为Agent输出格式。HTML能集成CSS和交互组件，大幅提升信息密度与双向交互体验。

https://x.com/trq212/status/2052809885763747935
https://thariqs.github.io/html-effectiveness/
https://simonwillison.net/2026/May/8/unreasonable-effectiveness-of-html/

Nathan Lambert发文总结其中国AI实验室之行 `#17`

AI2 成员 Nathan Lambert 发文总结其中国 AI 实验室之行。他观察到，中国团队凭借年轻化与扁平化结构，形成了专注打磨 大语言模型 的工程文化。这一生态展现出用较少资源构建前沿 模型 的独特优势。

https://www.interconnects.ai/p/notes-from-inside-chinas-ai-labs

DeepSeek 网页与 API 服务发生短时间大规模中断 `#18`

DeepSeek网页端与API服务于5 月 8 日下午发生约一个小时的大规模中断，系统频繁报出429、503 等错误，并提示服务太忙。当天下午 6 点 05 分，网页与 API服务已全面恢复正常，官方暂未公布具体中断原因。

https://status.deepseek.com/
https://linux.do/t/topic/2134675/4

Anthropic 一季度营收增 80 倍，Mythos 能力遭质疑 `#19`

Anthropic CEO Amodei 透露，Anthropic今年一季度营收与使用量暴增80倍。他还澄清 Mythos 模型供给难点在于控制访问权限以防范风险而非算力限制。与此同时有相关讨论指出，旧模型也能发现 Mythos 模型发现的相同漏洞，质疑其能力涉嫌夸大炒作。

https://www.cnbc.com/2026/05/06/anthropic-ceo-dario-amodei-says-company-crew-80-fold-in-first-quarter.html
https://www.cnbc.com/2026/05/08/anthropic-mythos-ai-cybersecurity-banks.html

Cloudflare 裁减 1100 人适应 AI Agent 时代重构组织 `#20`

Cloudflare宣布将全球裁减超过1100名员工。此次调整旨在为AI Agent时代重构组织架构。离职员工将获得包含支付至2026年底全额基本工资在内的丰厚补偿。

https://blog.cloudflare.com/building-for-the-future/

NVIDIA 与 IREN 合作，将部署 5 吉瓦 AI 基础设施涉 21 亿美元投资 `#21`

NVIDIA与IREN宣布战略合作，计划结合DSX AI 工厂架构与数据中心专长，部署高达5吉瓦的AI基础设施。IREN授予NVIDIA最高21亿美元的购股权。双方将重点在德克萨斯州园区开展部署。

https://nvidianews.nvidia.com/news/nvidia-and-iren-announce-strategic-partnership-to-accelerate-deployment-of-up-to-5-gigawatts-of-ai-infrastructure

三部门印发智能体规范意见，明确 19 个典型应用场景 `#22`

国家网信办等部门印发《智能体规范应用与创新发展实施意见》。文件明确智能体是具备自主感知与执行能力的系统，要求通过建立分类分级治理框架来守牢安全底线。

https://mp.weixin.qq.com/s/n-y34W_XZiV5lCKHOkok2g

DeepSeek 传筹备 500 亿融资，6 月发布 V4.1 模型 `#23`

据报道，DeepSeek 正筹备目标达 500亿元 人民币的首轮外部融资。完成后估值有望突破 3500亿元。报道还指出，为加速商业化，该公司计划于 6月推出具备处理图像与音频能力的 V4.1 模型。相关融资与产品信息仍有待官方证实。

https://www.theinformation.com/articles/deepseek-to-raise-more-than-7-billion-as-startup-plots-revenue-efforts
https://the-decoder.com/ai-money-keeps-flowing-as-deepseek-plans-record-raise-and-core-automation-quadruples-valuation-in-weeks/

阶跃星辰传完成 25 亿美元融资，加速筹备赴港上市 `#24`

据报道，阶跃星辰即将完成近25亿美元融资，有望成为中国大模型领域最大单笔融资。报道指出，阶跃星辰已拆除红筹架构并完成股改，加速筹备赴港上市。

https://zhidx.com/p/556043.html

AI 早报 2026-05-09

概览

模型发布

开发生态

产品应用

技术与洞察

行业动态

前瞻与传闻

蚂蚁百灵发布 Ring-2.6-1T，OpenRouter 免费试用一周 #1

智谱发布 GLM-5V-Turbo 报告，开放Coding Plan用户申请使用 #2

商汤科技推出SenseNova 6.7 Flash-Lite #3

阶跃星辰发布 StepAudio 2.5 Realtime 实时语音大模型 #4

AI2 发布 EMO 模型，实现混合专家语义模块化 #5

千问团队开源 WebWorld 世界模型面向 Web Agent 训练 #6

OpenClaw 发布 2026.5.7 版，强化权限与更新流程 #7

AWS 发布 Agent Toolkit for AWS 工具集 #8

Kiro 首次付费奖励 20 美元等值积分 #9

Grok 连接器功能正式上线安卓 iOS 及网页端 #10

Google Health Coach 结束预览面向全球上线 #11

Anthropic 发文阐述消除 Claude 的 agentic misalignment 行为 #12

MiniMax 修复 M2 模型稀疏 Token 遗忘及小语种混杂问题 #13

Google DeepMind 发布 AI Co-Mathematician #14

阿里巴巴提出 CDM 框架，四步推理实现图像生成最优 #15

Claude Code团队成员发文主张 HTML 替代 Markdown 作为 Agent 输出格式 #16

Nathan Lambert发文总结其中国AI实验室之行 #17

DeepSeek 网页与 API 服务发生短时间大规模中断 #18

Anthropic 一季度营收增 80 倍，Mythos 能力遭质疑 #19

Cloudflare 裁减 1100 人适应 AI Agent 时代重构组织 #20

NVIDIA 与 IREN 合作，将部署 5 吉瓦 AI 基础设施涉 21 亿美元投资 #21

三部门印发智能体规范意见，明确 19 个典型应用场景 #22

DeepSeek 传筹备 500 亿融资，6 月发布 V4.1 模型 #23

阶跃星辰传完成 25 亿美元融资，加速筹备赴港上市 #24

蚂蚁百灵发布 Ring-2.6-1T，OpenRouter 免费试用一周 `#1`

智谱发布 GLM-5V-Turbo 报告，开放Coding Plan用户申请使用 `#2`

商汤科技推出SenseNova 6.7 Flash-Lite `#3`

阶跃星辰发布 StepAudio 2.5 Realtime 实时语音大模型 `#4`

AI2 发布 EMO 模型，实现混合专家语义模块化 `#5`

千问团队开源 WebWorld 世界模型面向 Web Agent 训练 `#6`

OpenClaw 发布 2026.5.7 版，强化权限与更新流程 `#7`

AWS 发布 Agent Toolkit for AWS 工具集 `#8`

Kiro 首次付费奖励 20 美元等值积分 `#9`

Grok 连接器功能正式上线安卓 iOS 及网页端 `#10`

Google Health Coach 结束预览面向全球上线 `#11`

Anthropic 发文阐述消除 Claude 的 agentic misalignment 行为 `#12`

MiniMax 修复 M2 模型稀疏 Token 遗忘及小语种混杂问题 `#13`

Google DeepMind 发布 AI Co-Mathematician `#14`

阿里巴巴提出 CDM 框架，四步推理实现图像生成最优 `#15`

Claude Code团队成员发文主张 HTML 替代 Markdown 作为 Agent 输出格式 `#16`

Nathan Lambert发文总结其中国AI实验室之行 `#17`

DeepSeek 网页与 API 服务发生短时间大规模中断 `#18`

Anthropic 一季度营收增 80 倍，Mythos 能力遭质疑 `#19`

Cloudflare 裁减 1100 人适应 AI Agent 时代重构组织 `#20`

NVIDIA 与 IREN 合作，将部署 5 吉瓦 AI 基础设施涉 21 亿美元投资 `#21`

三部门印发智能体规范意见，明确 19 个典型应用场景 `#22`

DeepSeek 传筹备 500 亿融资，6 月发布 V4.1 模型 `#23`

阶跃星辰传完成 25 亿美元融资，加速筹备赴港上市 `#24`