1. DeepSeek 启动 500 亿元首轮融资,梁文锋个人出资 200 亿元
日期: 2026年5月9日(The Information、券商中国报道)
事件: DeepSeek 正式启动史上首轮大规模外部融资,目标金额高达 500 亿元人民币(约 73.5 亿美元),若成功将创中国 AI 公司单轮融资纪录。创始人梁文锋个人出资 200 亿元,占总融资额的 40%。公司估值升至 500 亿美元(约 3500 亿元)。同时,V4.1 版本定档 6 月发布,将新增图像与音频处理的多模态能力。
值得关注: 梁文锋以个人 200 亿出资展现出极强的信心。500 亿融资规模远超 Kimi(20 亿美元)和 Anthropic(500 亿美元但已启动 Pre-IPO),标志着中国大模型行业从"轻资产技术竞赛"正式跨入"重资产算力军备阶段"。V4.1 的多模态升级也将补齐 DeepSeek 在视觉和音频领域的短板。
2. 蚂蚁百灵发布万亿参数思考模型 Ring-2.6-1T
日期: 2026年5月9日
事件: 蚂蚁集团旗下百灵发布万亿参数(1T)思考模型 Ring-2.6-1T,主打复杂生产场景,搭载可调节推理强度机制。提供两种模式:High 模式侧重低 Token 开销、快速多步执行,适配高频 Agent 协作(PinchBench 得分 87.60);XHigh 模式专注数学竞赛、复杂逻辑推演(AIME26 达 95.83 分,GPQA Diamond 88.27 分)。模型已在 OpenRouter 上线并提供一周免费体验,近期计划开源。
值得关注: 万亿参数思考模型再次刷新国内大模型规模天花板。"可调节推理强度"机制直接针对智能体场景的实用痛点——在 Agent 协作中灵活平衡推理效果与资源消耗,这对降低企业部署成本有直接意义。开源计划将加速开发者生态建设。
3. 百度文心大模型 5.1 正式发布,成本压缩至业界同规模的 6%
日期: 2026年5月9日
事件: 百度发布文心大模型 5.1,通过多维弹性预训练技术将总参数量压缩至约 1/3、激活参数减半,预训练成本仅为业界同规模模型的 6%。搜索能力在 LMArena 国际榜单中位列全球第四、国内第一(1223 分),Agent 能力超越 DeepSeek-V4-Pro,创意写作比肩 Gemini 3.1 Pro。
值得关注: 在各大模型公司"烧钱竞赛"中,文心 5.1 走出了一条"极致降本"路线——成本压缩到行业最低的同时,性能并未缩水。这对百度在大模型商业化竞争中具有战略意义,尤其是对中小企业客户而言,更低成本获得 SOTA 级模型能力是核心吸引力。
4. 中国移动 AI 模型服务平台上线,接入超 300 款大模型
日期: 2026年5月9日
事件: 中国移动 AI 模型服务平台正式上线,接入超 300 款国内主流大模型,是国内模型数量最多的集成化平台。平台通过首创的 Token 集约化运营模式,实现单位 Token 调用成本降低约 30%、资源占用减少 50% 以上,日均调用量已突破千亿级别。提供成本优先、效果优先、均衡优先三种筛选模式,具备秒级自动切换能力。
值得关注: 运营商入局大模型平台层是一个重要信号。中国移动凭借庞大的用户基数和算力基础设施,正在成为 AI 基础设施的"管道级"玩家。300 款模型的集成规模加上 30% 的降本效果,对中小开发者极具吸引力,可能成为大模型商业化的重要分发渠道。
5. 阶跃星辰发布 StepAudio 2.5 Realtime 实时语音大模型
日期: 2026年5月9日
事件: 阶跃星辰发布 StepAudio 2.5 Realtime 实时语音模型,核心突破包括:副语言感知(可识别语调、语速、停顿、叹息等非文字信号,精准感知情绪)和人设自定义(支持通过 API 调节角色性格,基于万级原生人设生成百万级特征矩阵)。用户体验得分 80.41,显著高于 GPT-Realtime-1.5、Gemini Live 等同类产品。
值得关注: 此前阶跃星辰刚完成近 25 亿美元融资并推进港股上市(5月8日)。StepAudio 2.5 的"情绪感知 + 人设定制"能力,直接指向了智能体在人机交互中最重要的维度——情感连接。这是智能体从"完成任务"走向"有温度对话"的关键一步。
6. Allen AI 发布 EMO 模型:MoE 架构的范式转移
日期: 2026年5月9日(Hugging Face / Allen AI)
事件: Allen Institute for AI 与 UC Berkeley 联合发布 EMO(Emergent Modularity)研究项目,在 MoE(混合专家)模型的预训练阶段通过文档级专家池约束,使专家组从数据中自然涌现模块化。用户可以选择小规模的特定任务专家子集,同时保持接近全模型的推理性能。1B/14B 参数版本已开源验证。
值得关注: MoE 架构的核心痛点一直是如何真正"按需激活"——大多数 MoE 模型虽然推理时只激活部分专家,但部署时仍需加载全部参数。EMO 从预训练源头解决这个问题,为高效部署大模型提供了新思路。这对降低推理成本、加速智能体在边缘设备的部署具有里程碑意义。
7. OpenAI 官方 CLI 工具 openai-cli 开源发布
日期: 2026年5月8日
事件: OpenAI 正式推出官方命令行工具 openai-cli,采用 Apache 2.0 协议开源。开发者无需编写 SDK 代码即可在终端直接调用 OpenAI 最新模型与多模态能力,支持 Homebrew 或 Go 安装。
值得关注: 这是 OpenAI 首次推出官方 CLI 工具,降低了开发者体验和 AI 工具链的集成门槛。在 AI Agent 开发领域(如 Claude Code、OpenClaw 等均以终端为核心交互界面),官方 CLI 的推出意味着 OpenAI 正在积极拥抱开发者生态,直接参与"终端优先"的 AI 工具链竞争。
8. 苹果首款 AI 可穿戴设备:带摄像头 AirPods 进入 DVT 阶段
日期: 2026年5月8日(彭博社 Mark Gurman 报道)
事件: 知名爆料人 Mark Gurman 透露,苹果内置摄像头的 AirPods 已进入设计验证(DVT)后期阶段,接近试产,最快 9 月推出。该设备旨在通过内置摄像头增强 AI 感知能力而非拍照,将成为苹果首款真正的 AI 可穿戴设备,为 Siri 提供"视觉"能力。
值得关注: 这是苹果在 AI 硬件领域的重大布局。与纯软件智能体不同,带视觉能力的 AI 耳机将开创"听觉+视觉+空间感知"的全栈 AI 交互范式,直接对标 Google Glass、Ray-Ban Meta 等竞品。9 月发布窗口意味着 AI 可穿戴设备竞争可能在下半年全面爆发。
9. 智谱 GLM-5V-Turbo 向 Coding Plan 用户开放
日期: 2026年5月9日(4月2日发布技术报告,5月9日开放申请)
事件: 智谱 AI 向 GLM Coding Plan 用户开放 GLM-5V-Turbo 多模态编码基座模型的使用申请。该模型从预训练阶段深度融合视觉与文本能力,将"看图"能力原生嵌入编码场景,智能体可通过理解截图、设计稿等视觉输入直接生成代码。
值得关注: 多模态 Coding 是当前智能体开发中最有想象力的方向之一——让 AI 像人类开发者一样"看到"界面设计稿然后写出对应代码,这将大幅降低从需求到实现的信息损耗。智谱选择先面向 Coding Plan 用户开放,也反映了该模型的定位核心是开发者工具链。
10. 商汤科技推出 SenseNova 6.7 Flash-Lite 轻量多模态智能体模型
日期: 2026年5月9日
事件: 商汤科技旗下日日新 SenseNova 平台推出 6.7 Flash-Lite 模型,定位为面向真实工作流的轻量多模态智能体模型。在长链路任务、规划能力与多模态理解上表现突出,适用于需要快速响应和低成本部署的智能体场景。
值得关注: 商汤从 GPU 厂商向大模型厂商转型的战略进一步落地。Flash-Lite 定位"轻量"意味着更低的推理成本和更广泛的部署场景,这对于企业级智能体的大规模部署至关重要。在万亿参数"大模型军备竞赛"中,商汤选择了"轻量高效"的差异化路线。
信息来源:财新网、知乎、新浪财经、中新网、Allan AI、Hugging Face、彭博社、商汤科技、AITop100 等
夜雨聆风