
AI 早报 2026-05-09
概览
模型发布
蚂蚁百灵发布 Ring-2.6-1T,OpenRouter 免费试用一周 #1智谱发布 GLM-5V-Turbo 报告,开放Coding Plan用户申请使用 #2商汤科技推出SenseNova 6.7 Flash-Lite #3阶跃星辰发布 StepAudio 2.5 Realtime 实时语音大模型 #4AI2 发布 EMO 模型,实现混合专家语义模块化 #5千问团队开源 WebWorld 世界模型面向 Web Agent 训练 #6
开发生态
OpenClaw 发布 2026.5.7 版,强化权限与更新流程 #7AWS 发布 Agent Toolkit for AWS 工具集 #8Kiro 首次付费奖励 20 美元等值积分 #9
产品应用
Grok 连接器功能正式上线安卓 iOS 及网页端 #10Google Health Coach 结束预览面向全球上线 #11
技术与洞察
Anthropic 发文阐述消除 Claude 的 agentic misalignment 行为 #12MiniMax 修复 M2 模型稀疏 Token 遗忘及小语种混杂问题 #13Google DeepMind 发布 AI Co-Mathematician #14阿里巴巴提出 CDM 框架,四步推理实现图像生成最优 #15Claude Code团队成员发文主张 HTML 替代 Markdown 作为 Agent 输出格式 #16Nathan Lambert发文总结其中国AI实验室之行 #17
行业动态
DeepSeek 网页与 API 服务发生短时间大规模中断 #18Anthropic 一季度营收增 80 倍,Mythos 能力遭质疑 #19Cloudflare 裁减 1100 人适应 AI Agent 时代重构组织 #20NVIDIA 与 IREN 合作,将部署 5 吉瓦 AI 基础设施涉 21 亿美元投资 #21三部门印发智能体规范意见,明确 19 个典型应用场景 #22
前瞻与传闻
DeepSeek 传筹备 500 亿融资,6 月发布 V4.1 模型 #23阶跃星辰传完成 25 亿美元融资,加速筹备赴港上市 #24
蚂蚁百灵发布 Ring-2.6-1T,OpenRouter 免费试用一周 #1
蚂蚁百灵团队发布万亿参数旗舰思维模型
Ring-2.6-1T。该模型基于 63B 活跃参数,专为真实世界 Agent 工作流优化。它具有自适应推理努力机制,在多项基准测试中成绩领先。该模型目前已在OpenRouter和Kilo Code等平台开放一周免费试用。


https://x.com/AntLingAGI/status/2052808934390661134
https://openrouter.ai/inclusionai/ring-2.6-1t:free智谱发布 GLM-5V-Turbo 报告,开放Coding Plan用户申请使用 #2
智谱AI发布了GLM-5V-Turbo多模态基座模型的技术报告。并向GLM Coding Plan用户开放该模型的体验申请。


https://zhipu-ai.feishu.cn/share/base/form/shrcndgpmRlJoD5rMmIavUrPwzg
https://mp.weixin.qq.com/s/7mkpCpz2M2ozkaM8Vfn2Pg商汤科技推出SenseNova 6.7 Flash-Lite #3
商汤科技推出轻量化多模态智能体模型
SenseNova 6.7 Flash-Lite。它取消视觉转文本中间层,能直接看懂复杂图表,实现感知到行动一体化。用户可通过办公小浣熊免费体验该模型。

https://mp.weixin.qq.com/s/n5CZvuoHfjDsIPDmN0g6tA
https://github.com/OpenSenseNova/SenseNova6.7阶跃星辰发布 StepAudio 2.5 Realtime 实时语音大模型 #4
阶跃星辰推出端到端实时语音大模型 StepAudio 2.5 Realtime。该模型主打中英文“活人感”对话,能精准捕捉轻笑等副语言细节并动态调整回应。该模型已在
Step Plan等渠道全量上线。

https://stepaudiollm.github.io/step-audio-2.5-realtime/
https://platform.stepfun.com/docs/zh/guides/models/stepaudio-2.5-realtimeAI2 发布 EMO 模型,实现混合专家语义模块化 #5
AI2 发布全新的端到端预训练混合专家模型 EMO。它打破 Token 独立路由的惯例,利用文档边界作弱监督。促使
expert按新闻、健康等语义领域自发形成模块,让模型能高效调用专家子集。

https://allenai.org/blog/emo
https://github.com/allenai/EMO
https://huggingface.co/collections/allenai/emo千问团队开源 WebWorld 世界模型面向 Web Agent 训练 #6
Qwen团队开源了WebWorld大型开放网络世界模型系列。该系列包含基于
Qwen3微调的8B、14B和32B三个版本。模型基于百万条真实网页轨迹训练,专供Web Agent的训练与评估使用。

https://github.com/QwenLM/WebWorld
https://huggingface.co/Qwen/WebWorld-8BOpenClaw 发布 2026.5.7 版,强化权限与更新流程 #7
OpenClaw 发布 2026.5.7 版本。新版本强化了原生命令与
Active Memory权限管控。同时优化了 CLI 工具及插件 npm 更新流程。

https://x.com/openclaw/status/2052508303687651717AWS 发布 Agent Toolkit for AWS 工具集 #8
AWS 发布了 Agent Toolkit for AWS 工具集。它整合
MCP服务器、技能与插件,能辅助 Claude Code 等编程 Agent 在 AWS 上构建应用。

https://github.com/aws/agent-toolkit-for-aws
https://docs.aws.amazon.com/agent-toolkit/latest/userguide/Kiro 首次付费奖励 20 美元等值积分 #9
Kiro推出升级奖励。通过社交登录或 Builder ID 首次升级至任意付费计划的用户,绑定信用卡后,可获得价值 20 美元的 1000 积分额度。

https://kiro.dev/blog/new-paid-tier-bonus/Grok 连接器功能正式上线安卓 iOS 及网页端 #10
Grok宣布连接器功能已在安卓、iOS及网页端上线,所有订阅用户均可使用。

https://x.com/grok/status/2052782088181727613Google Health Coach 结束预览面向全球上线 #11
谷歌宣布基于
Gemini模型的 AI 健康教练Google Health Coach正式上线。该服务率先面向 Fitbit 与 Pixel Watch 用户推出。Google AI Pro 与 Ultra 用户可免费使用。

https://blog.google/products-and-platforms/products/google-health/google-health-coach/
https://research.google/blog/how-we-are-building-the-personal-health-coach/Anthropic 发文阐述消除 Claude 的 agentic misalignment 行为 #12
Anthropic 发布一项题为“Teaching Claude why”的研究,详细阐述了其如何消除 Claude 模型中的
agentic misalignment行为。研究发现,仅通过行为示范进行训练效果有限,而教导模型深刻理解伦理原则能带来更根本的改善。

https://www.anthropic.com/research/teaching-claude-why
https://www-cdn.anthropic.com/bf10f64990cfda0ba858290be7b8cc6317685f47.pdfMiniMax 修复 M2 模型稀疏 Token 遗忘及小语种混杂问题 #13
MiniMax团队成员在知乎发布分析,解释 M2 系列模型无法生成 马嘉祺 等低频词的问题。这源于后训练数据分布不均,导致低频
Token在输出层发生表征漂移。官方通过混入覆盖全词表的合成数据进行修复,成功解决了词汇遗忘问题,并将日语等小语种混淆率降至 百分之 1。

https://www.zhihu.com/question/undefined/answer/2036149386116342692Google DeepMind 发布 AI Co-Mathematician #14
Google DeepMind 发布
AI Co-Mathematician多 Agent 工作台,辅助数学家进行定理证明与理论构建,并在FrontierMath Tier 4测试中以 48% 的得分创下新高。同时,Alex Imas 出任该部门 AGI 经济学总监,研究前沿 AI 对经济与工作形态的重塑。

https://x.com/pushmeet/status/2052812585804685322
https://arxiv.org/abs/2605.06651
https://x.com/alexolegimas/status/2052778908882174302阿里巴巴提出 CDM 框架,四步推理实现图像生成最优 #15
阿里巴巴联合高校团队提出“连续时间分布匹配”
CDM框架,将扩散模型的蒸馏从离散锚点推向连续时间优化。该方案仅需4 步推理即可实现SOTA级图像生成质量。

https://byliutao.github.io/cdm_page/
https://arxiv.org/abs/2605.06376Claude Code团队成员发文主张 HTML 替代 Markdown 作为 Agent 输出格式 #16
Claude Code团队成员发文,主张用HTML替代
Markdown作为Agent输出格式。HTML能集成CSS和交互组件,大幅提升信息密度与双向交互体验。

https://x.com/trq212/status/2052809885763747935
https://thariqs.github.io/html-effectiveness/
https://simonwillison.net/2026/May/8/unreasonable-effectiveness-of-html/Nathan Lambert发文总结其中国AI实验室之行 #17
AI2 成员 Nathan Lambert 发文总结其中国 AI 实验室之行。他观察到,中国团队凭借年轻化与扁平化结构,形成了专注打磨
大语言模型的工程文化。这一生态展现出用较少资源构建前沿模型的独特优势。

https://www.interconnects.ai/p/notes-from-inside-chinas-ai-labsDeepSeek 网页与 API 服务发生短时间大规模中断 #18
DeepSeek网页端与API服务于5 月 8 日下午发生约一个小时的大规模中断,系统频繁报出
429、503等错误,并提示服务太忙。当天下午 6 点 05 分,网页与 API服务已全面恢复正常,官方暂未公布具体中断原因。

https://status.deepseek.com/
https://linux.do/t/topic/2134675/4Anthropic 一季度营收增 80 倍,Mythos 能力遭质疑 #19
Anthropic CEO Amodei 透露,Anthropic今年一季度营收与使用量暴增80倍。他还澄清
Mythos模型供给难点在于控制访问权限以防范风险而非算力限制。与此同时有相关讨论指出,旧模型也能发现Mythos模型发现的相同漏洞,质疑其能力涉嫌夸大炒作。
https://www.cnbc.com/2026/05/06/anthropic-ceo-dario-amodei-says-company-crew-80-fold-in-first-quarter.html
https://www.cnbc.com/2026/05/08/anthropic-mythos-ai-cybersecurity-banks.htmlCloudflare 裁减 1100 人适应 AI Agent 时代重构组织 #20
Cloudflare宣布将全球裁减超过1100名员工。此次调整旨在为
AI Agent时代重构组织架构。离职员工将获得包含支付至2026年底全额基本工资在内的丰厚补偿。

https://blog.cloudflare.com/building-for-the-future/NVIDIA 与 IREN 合作,将部署 5 吉瓦 AI 基础设施涉 21 亿美元投资 #21
NVIDIA与IREN宣布战略合作,计划结合
DSXAI 工厂架构与数据中心专长,部署高达5吉瓦的AI基础设施。IREN授予NVIDIA最高21亿美元的购股权。双方将重点在德克萨斯州园区开展部署。
https://nvidianews.nvidia.com/news/nvidia-and-iren-announce-strategic-partnership-to-accelerate-deployment-of-up-to-5-gigawatts-of-ai-infrastructure三部门印发智能体规范意见,明确 19 个典型应用场景 #22
国家网信办等部门印发《智能体规范应用与创新发展实施意见》。文件明确智能体是具备自主感知与执行能力的系统,要求通过建立分类分级治理框架来守牢安全底线。
https://mp.weixin.qq.com/s/n-y34W_XZiV5lCKHOkok2gDeepSeek 传筹备 500 亿融资,6 月发布 V4.1 模型 #23
据报道,DeepSeek 正筹备目标达 500亿元 人民币的首轮外部融资。完成后估值有望突破 3500亿元。报道还指出,为加速商业化,该公司计划于 6月 推出具备处理图像与音频能力的
V4.1模型。相关融资与产品信息仍有待官方证实。
https://www.theinformation.com/articles/deepseek-to-raise-more-than-7-billion-as-startup-plots-revenue-efforts
https://the-decoder.com/ai-money-keeps-flowing-as-deepseek-plans-record-raise-and-core-automation-quadruples-valuation-in-weeks/阶跃星辰传完成 25 亿美元融资,加速筹备赴港上市 #24
据报道,阶跃星辰即将完成近25亿美元融资,有望成为中国大模型领域最大单笔融资。报道指出,阶跃星辰已拆除红筹架构并完成股改,加速筹备赴港上市。
https://zhidx.com/p/556043.html
夜雨聆风