每日 AI 新闻精选|2026年5月9日(周六)
一、今日重磅
- OpenAI 推出三款实时语音模型,GPT-Realtime-2 首次将 GPT-5 级推理接入语音
事件内容:OpenAI 正式发布三款实时音频模型,全部接入 Realtime API 供开发者调用。其中核心模型 GPT-Realtime-2 是首款具备 GPT-5 级推理能力的语音模型,可在对话过程中进行复杂推理、调用工具,并支持用户打断或纠正,支持 128K 上下文,定价为输入 $32/百万 Token、输出 $64/百万 Token。另两款 GPT-Realtime-Translate(支持 70 种语言实时翻译,$0.034/分钟)和 GPT-Realtime-Whisper(低延迟流式转录,$0.017/分钟)同步发布,彻底重构了 AI 语音智能体的底层能力。
信息来源:https://finance.sina.com.cn/tech/digi/2026-05-08/doc-inhxcusp2322995.shtml
- Cloudflare 宣布裁员超 1100 人,内部 AI 使用量三个月暴增 600% 重构为 Agent 时代
事件内容:Cloudflare 宣布在全球裁减超过 1100 名员工,约占员工总数的 20%。CEO Matthew Prince 明确表示这并非成本削减,而是公司内部工作方式已根本改变——各部门每天运行数千个 AI Agent 会话,过去三个月内部 AI 使用量激增 600% 以上。此次裁员是为"agentic AI 时代"彻底重构组织架构的一次性行动,补偿方案包括 2026 年全年基本工资,是 AI 规模化落地重塑企业组织结构的标志性事件。
信息来源:https://news.qq.com/rain/a/20260508A04Y5000
- Anthropic 开源 NLA:首次将 Claude 内部激活值翻译成自然语言,AI 黑箱被撬开
事件内容:Anthropic 发布并开源自然语言自编码器(Natural Language Autoencoders,NLA)技术,首次实现对大模型内部思维过程的可读化解析。NLA 通过将模型内部的数字激活状态直接"翻译"成自然语言,让用户可以直接阅读 Claude 在生成回答前的真实思考过程,隐藏动机发现率提升 4 倍。底层采用双模型博弈机制:一个模型将激活转成文字,另一个试图还原激活,通过强化学习持续提高准确率。相关代码与部分模型权重已开源至 GitHub,同步将对齐工具 Petri 捐赠给 Meridian Labs 并发布重大更新。
信息来源:https://news.qq.com/rain/a/20260508A08SBO00
- 英伟达 Jim Fan 预判机器人物理 AI 大突破:直接抄 LLM 作业,2040 年解锁全科技树
事件内容:英伟达具身自主研究负责人 Jim Fan 在红杉资本 AI Ascent 大会上发表演讲,提出"大平行"理论——机器人学习将完整复制 LLM 三阶段发展路径(预训练→微调→强化学习)。他宣告 VLA(视觉-语言-动作)模型已死,新一代"世界动作模型(WAM)"取而代之,通过视频预测学习物理规律,实现零样本泛化。Jim Fan 以 95% 的置信度押注:2040 年前机器人将彻底解锁从"物理图灵测试"到"物理自动研究"的完整科技树。英伟达 Dream Zero 世界动作模型和神经物理引擎 Dream Dojo 同步推进。
信息来源:https://news.qq.com/rain/a/20260509A00DP400
- OpenClaw v2026.5.7 发布:超 30 项修复覆盖插件、消息通道、定时任务、安全权限
事件内容:OpenClaw 正式发布 v2026.5.7 版本,这是一个以稳定性和可靠性为核心的维护性更新,超过 30 项修复覆盖多个关键领域:插件发布引入瞬态依赖安装失败自动重试、新增对 openai/chat-latest 模型的直接 API 密钥覆盖支持、Discord/Telegram/WhatsApp/飞书等平台关键 Bug 修复、Active Memory 升级为管理员权限要求、命令原生所有者强制执行等安全加固。建议所有用户通过 openclaw update 立即升级,特别是使用即时通讯渠道的用户。
信息来源:https://www.pangshare.com/openclaw-2026-5-7-release-notes/
- OpenAI 推出 GPT-5.5-Cyber 网络安全专用模型,面向关键基础设施防御人员
事件内容:OpenAI 发布 GPT-5.5-Cyber,这是一款专为网络安全防御人员设计的专用模型,目前处于有限预览阶段,需通过严格身份验证才能访问。该模型基于 GPT-5.5 底座,针对漏洞分析、威胁情报、网络防御场景深度优化,是 OpenAI 继 GPT-Realtime-2 之后当天的第二款重磅模型发布,标志着 OpenAI 正在向垂直安全领域深度渗透。
信息来源:https://unifuncs.com/s/nt6kbfqe
- 月之暗面完成约 20 亿美元融资,投后估值破 200 亿美元,美团龙珠领投
事件内容:5 月 7 日,月之暗面(Kimi)正式确认完成新一轮约 20 亿美元融资,投后估值突破 200 亿美元,本轮由美团旗下龙珠资本领投,水木资本、中国移动、CPE 源峰等参投。今年以来 Kimi 已累计完成四轮融资总额超 39 亿美元,成为国内大模型创业公司中累计融资最多的公司。此前月之暗面还申请注册"KimiClaw"商标,引发其进军硬件市场的强烈猜测。
信息来源:https://www.caixin.com/2026-05-08/102441805.html
- DeepSeek 首轮融资估值达 450 亿美元,国家大基金拟领投,中国大模型双雄融资潮
事件内容:国家集成电路产业投资基金(大基金)被曝正与 DeepSeek 洽谈首轮融资,估值直奔 450 亿美元(约合人民币 3000 亿元)。与月之暗面同日传出的双重融资消息,被业界视为中国大模型赛道的 2026 年里程碑。DeepSeek 此前一直维持"纯技术研究公司"定位,此次首次外部融资若落定,意味着其商业化步伐将大幅加速。
信息来源:https://www.36kr.com/p/3799097625926917
- Anthropic 发布"经济扩散、威胁韧性、AI 递归自我改进"四大研究方向,深度布局安全
事件内容:Anthropic 研究院于 5 月 8 日公布四大核心研究方向:经济扩散(AI 对劳动力市场的影响)、威胁韧性(AI 系统遭受攻击时的鲁棒性)、AI 递归自我改进(AI 自我优化的边界与风险),以及 Claude 安全对齐的深度研究。这是 Anthropic 在模型公司向智能体平台转型期间,系统阐述其安全研究战略的重要公开表态,对齐研究被提升至公司战略级别。
信息来源:https://news.daheiai.com/
- Google 发布 Gemini 3.1 Flash-Lite 正式版,轻量高速定价低至 $0.25/百万 Token
事件内容:Google 于 5 月 8 日正式将 Gemini 3.1 Flash-Lite 推向 GA(正式可用)阶段,预览版同步下线。该模型主打轻量高速,定价为输入 $0.25/百万 Token,输出 $1.5/百万 Token,成为目前谷歌模型家族中价格最低的正式版模型。Flash-Lite 的 GA 发布完善了 Gemini 3.1 系列的产品矩阵,为开发者提供高性价比的生产级选择。
信息来源:https://unifuncs.com/s/nt6kbfqe
- 火山方舟上线 Agent Plan 个人订阅套餐,支持视频图片生成,40元/月起
事件内容:字节跳动旗下火山方舟于 5 月 7 日正式上线 Agent Plan 个人订阅套餐,新增对视频、图片生成能力的支持,采用 AFP 积分计费体系,套餐价格从 40 元/月到 1000 元/月分多档设置。此举被视为字节在 AI 应用层的重要商业化布局,与豆包付费订阅三档体系形成呼应,进一步打通从底层大模型到用户侧 Agent 的完整商业闭环。
信息来源:https://unifuncs.com/s/nt6kbfqe
- OpenAI Codex 发布 Chrome 扩展,支持浏览器后台并行多任务 + Vim 模式
事件内容:OpenAI Codex 正式推出 Chrome 浏览器扩展,支持跨标签页并行任务处理,开发者可以在浏览网页的同时让 Codex 在后台执行代码任务,新增 Vim 模式支持。同步开源了 openai-cli 命令行工具,将 REST API 映射为 shell 命令,采用 Apache 2.0 协议,进一步降低 AI 编程工具的使用门槛。Codex Chrome 扩展是继 Mac 应用接管整台电脑之后,OpenAI 向开发者工作流进一步渗透的关键动作。
信息来源:https://unifuncs.com/s/nt6kbfqe
- Hermes Agent v0.13.0 "坚韧版"正式发布,持久化多 Agent 看板+修复 8 个 P0 级漏洞
事件内容:NousResearch 开源的 Hermes Agent 正式发布 v0.13.0 版本,代号"Tenacity Release(坚韧版)"。核心新功能是持久化多 Agent 协作看板(Durable Kanban),可将任务分发给多个 Hermes Agent 并行处理,支持任务交接、心跳监测和自动关闭,解决了长程任务的可靠性问题。本版本同时修复了 8 个 P0 级关键漏洞,包括会话崩溃、Gemini 工具调用回放、内存泄漏等核心问题,是 Hermes 迄今稳定性提升最大的一次发布。
信息来源:https://hermesai.top/changelog.html
- xAI 并入 SpaceX 更名 SpaceXAI,同步推出 Grok Imagine Quality Mode API
事件内容:xAI 于 5 月 6-7 日宣布并入 SpaceX,正式更名为 SpaceXAI,22 万张 GPU 算力通过此前协议已全部供 Anthropic 使用。与此同时,SpaceXAI 推出 Grok Imagine Quality Mode API,提供高真实感图像生成能力,支持精细细节和文本渲染,并向开发者开放调用。这是马斯克整合旗下 AI 资产后,SpaceXAI 以全新身份对外亮相的首批产品动作。
信息来源:https://unifuncs.com/s/nt6kbfqe
- 基流科技冲刺港股"AI 基础设施第一股",清华 90 后三人组估值超 91 亿
事件内容:上海基流科技股份有限公司(由三位具有清华/北大背景的 90 后创始人创立)正式向港交所递交招股书,拟在香港主板上市,独家保荐人为国泰君安国际,智谱旗下星连资本为第一大外部股东。基流科技是中国规模最大的独立 AI 算力集群提供商,投后估值达 91.6 亿元,凭借 Mercury 全国产化端到端 AI 算力集群产品及跨 1500 公里分布式训练能力打造核心竞争力。
信息来源:https://finance.sina.com.cn/jjxw/2026-05-08/doc-inhxfamx7466076.shtml
- DeepL 宣布裁员 250 人(占比 25%),战略转向实时语音翻译,收购 Mixhalo 团队
事件内容:翻译工具 DeepL 于 5 月 7-8 日宣布裁员约 250 人,约占员工总数的 25%。此次裁员与 Cloudflare 同步发生,原因同样是 AI 驱动的业务重构——DeepL 宣布收购实时语音翻译公司 Mixhalo 的团队,全面战略转向实时语音翻译赛道,这与 OpenAI 当天发布 GPT-Realtime-Translate 模型形成直接竞争布局。AI 正在同步冲击翻译工具的产品形态和公司组织。
信息来源:https://unifuncs.com/s/nt6kbfqe
- Zyphra 发布 ZAYA1-74B-Preview:首个完全基于 AMD 硬件训练的 740 亿参数 MoE 模型
事件内容:AI 初创公司 Zyphra 联合 AMD 和 IBM 发布 ZAYA1-74B-Preview,这是首个完全基于 AMD 硬件生态系统构建和训练的大型混合专家(MoE)大模型,总参数 740 亿,活跃参数 40 亿,在 IBM 云上完成全程训练,采用 Apache 2.0 许可证完全开源。此模型挑战了"大模型必须用英伟达 GPU"的行业惯例,对 AI 算力生态去英伟达化具有重要标志意义。
信息来源:https://unifuncs.com/s/nt6kbfqe
- Anthropic"算力帝国"成形:80 倍收入狂飙,与谷歌 2000 亿长约+SpaceX 22 万 GPU 双保险
事件内容:综合近两日最新报道,Anthropic 年化运行收入(ARR)已升至 440 亿美元,12 个月新增 350 亿美元,收入增速创史上最快记录,估值正在讨论突破 1.2 万亿美元(首次反超 OpenAI)。算力侧,Anthropic 与谷歌云签署 2000 亿美元五年协议,同时通过 SpaceX 合并取得对 22 万张 GPU 的算力支持。其中与 SpaceX Colossus 超算中心的协议使 Claude Code 用户 5 小时限额翻倍,彻底奠定算力护城河。
信息来源:https://finance.sina.com.cn/wm/2026-05-08/doc-inhxcust4305289.shtml
- OpenRouter 新增音频 API 和网页搜索工具,AI 聚合路由平台能力全面扩张
事件内容:OpenRouter 于 5 月 8 日宣布新增音频 API 和网页搜索工具,提供专用的 TTS/STT 端点和 web_search 工具,支持开发者通过统一接口调用不同模型的语音和搜索能力。OpenRouter 作为全球最大的 AI 模型路由聚合平台,此次扩容将进一步成为 Agent 时代的基础设施层,降低多模型多模态开发的工程复杂度。
信息来源:https://unifuncs.com/s/nt6kbfqe
- Amazon Bedrock AgentCore 引入支付能力,AI 代理迈向自主金融交易新阶段
事件内容:Amazon Bedrock AgentCore 宣布引入支付能力(Payment API),AI Agent 可在执行任务时自主发起和完成金融交易,无需人工介入。此功能是 Bedrock AgentCore 在 5 月 8 日的重要升级,延续了 Stripe 和 Cloudflare 此前推出"Agent 自主开户/买域名/做部署"协议的趋势,预示着 AI Agent 正在突破纯信息任务的边界,向自主经济行为体演进。
信息来源:https://news.daheiai.com/
二、宝哥今日洞察
AI 正在用"裁员+重构"两件事,向全球企业宣告一个新时代的到来。 Cloudflare 裁员 1100 人、DeepL 裁员 250 人——这两家公司都明确说:不是降本,是重构。这和过去讨论"AI 会不会抢工作"的语境完全不同——当一家公司三个月内 AI 使用量增长 600%,每天运行数千个 Agent,它根本不需要那么多人做"人肉 Agent"了。这不是威胁,这是现实。真正的问题不是"你的工作会不会被 AI 取代",而是"你能不能驾驭 Agent,让自己变成那个更值钱的人"。
中国大模型融资潮背后,是一场战略资本豪赌,而非纯商业逻辑。 DeepSeek 估值 450 亿美元(国家大基金拟领投)、月之暗面估值 200 亿美元(美团龙珠领投)——不到 24 小时内,两笔超级融资同步曝光。这里有一个细节值得关注:DeepSeek 从来不缺钱,但它选择在此时接受国家大基金投资,意味着中国 AI 战略格局正在重新凝聚。大模型不再只是创业赛道,它已经成为国家战略资产。这一轮融资的背后,不是 VC 逻辑,是地缘政治逻辑。
加入宝哥的AI交流群、openclaw龙虾交流群(注明来意才通过)。免费获取宝哥养虾笔记《openclaw从入门到token不够花指南》和《Hermes 入门指南》

夜雨聆风