AI 每日新闻精选 — 2026 年 5 月 11 日

1. DeepSeek 启动 500 亿元首轮融资，梁文锋个人出资 200 亿元

日期： 2026年5月9日（The Information、券商中国报道）

事件： DeepSeek 正式启动史上首轮大规模外部融资，目标金额高达 500 亿元人民币（约 73.5 亿美元），若成功将创中国 AI 公司单轮融资纪录。创始人梁文锋个人出资 200 亿元，占总融资额的 40%。公司估值升至 500 亿美元（约 3500 亿元）。同时，V4.1 版本定档 6 月发布，将新增图像与音频处理的多模态能力。

值得关注： 梁文锋以个人 200 亿出资展现出极强的信心。500 亿融资规模远超 Kimi（20 亿美元）和 Anthropic（500 亿美元但已启动 Pre-IPO），标志着中国大模型行业从"轻资产技术竞赛"正式跨入"重资产算力军备阶段"。V4.1 的多模态升级也将补齐 DeepSeek 在视觉和音频领域的短板。

2. 蚂蚁百灵发布万亿参数思考模型 Ring-2.6-1T

日期： 2026年5月9日

事件： 蚂蚁集团旗下百灵发布万亿参数（1T）思考模型 Ring-2.6-1T，主打复杂生产场景，搭载可调节推理强度机制。提供两种模式：High 模式侧重低 Token 开销、快速多步执行，适配高频 Agent 协作（PinchBench 得分 87.60）；XHigh 模式专注数学竞赛、复杂逻辑推演（AIME26 达 95.83 分，GPQA Diamond 88.27 分）。模型已在 OpenRouter 上线并提供一周免费体验，近期计划开源。

值得关注： 万亿参数思考模型再次刷新国内大模型规模天花板。"可调节推理强度"机制直接针对智能体场景的实用痛点——在 Agent 协作中灵活平衡推理效果与资源消耗，这对降低企业部署成本有直接意义。开源计划将加速开发者生态建设。

3. 百度文心大模型 5.1 正式发布，成本压缩至业界同规模的 6%

日期： 2026年5月9日

事件： 百度发布文心大模型 5.1，通过多维弹性预训练技术将总参数量压缩至约 1/3、激活参数减半，预训练成本仅为业界同规模模型的 6%。搜索能力在 LMArena 国际榜单中位列全球第四、国内第一（1223 分），Agent 能力超越 DeepSeek-V4-Pro，创意写作比肩 Gemini 3.1 Pro。

值得关注： 在各大模型公司"烧钱竞赛"中，文心 5.1 走出了一条"极致降本"路线——成本压缩到行业最低的同时，性能并未缩水。这对百度在大模型商业化竞争中具有战略意义，尤其是对中小企业客户而言，更低成本获得 SOTA 级模型能力是核心吸引力。

4. 中国移动 AI 模型服务平台上线，接入超 300 款大模型

日期： 2026年5月9日

事件： 中国移动 AI 模型服务平台正式上线，接入超 300 款国内主流大模型，是国内模型数量最多的集成化平台。平台通过首创的 Token 集约化运营模式，实现单位 Token 调用成本降低约 30%、资源占用减少 50% 以上，日均调用量已突破千亿级别。提供成本优先、效果优先、均衡优先三种筛选模式，具备秒级自动切换能力。

值得关注： 运营商入局大模型平台层是一个重要信号。中国移动凭借庞大的用户基数和算力基础设施，正在成为 AI 基础设施的"管道级"玩家。300 款模型的集成规模加上 30% 的降本效果，对中小开发者极具吸引力，可能成为大模型商业化的重要分发渠道。

5. 阶跃星辰发布 StepAudio 2.5 Realtime 实时语音大模型

日期： 2026年5月9日

事件： 阶跃星辰发布 StepAudio 2.5 Realtime 实时语音模型，核心突破包括：副语言感知（可识别语调、语速、停顿、叹息等非文字信号，精准感知情绪）和人设自定义（支持通过 API 调节角色性格，基于万级原生人设生成百万级特征矩阵）。用户体验得分 80.41，显著高于 GPT-Realtime-1.5、Gemini Live 等同类产品。

值得关注： 此前阶跃星辰刚完成近 25 亿美元融资并推进港股上市（5月8日）。StepAudio 2.5 的"情绪感知 + 人设定制"能力，直接指向了智能体在人机交互中最重要的维度——情感连接。这是智能体从"完成任务"走向"有温度对话"的关键一步。

6. Allen AI 发布 EMO 模型：MoE 架构的范式转移

日期： 2026年5月9日（Hugging Face / Allen AI）

事件： Allen Institute for AI 与 UC Berkeley 联合发布 EMO（Emergent Modularity）研究项目，在 MoE（混合专家）模型的预训练阶段通过文档级专家池约束，使专家组从数据中自然涌现模块化。用户可以选择小规模的特定任务专家子集，同时保持接近全模型的推理性能。1B/14B 参数版本已开源验证。

值得关注： MoE 架构的核心痛点一直是如何真正"按需激活"——大多数 MoE 模型虽然推理时只激活部分专家，但部署时仍需加载全部参数。EMO 从预训练源头解决这个问题，为高效部署大模型提供了新思路。这对降低推理成本、加速智能体在边缘设备的部署具有里程碑意义。

7. OpenAI 官方 CLI 工具 openai-cli 开源发布

日期： 2026年5月8日

事件： OpenAI 正式推出官方命令行工具 openai-cli，采用 Apache 2.0 协议开源。开发者无需编写 SDK 代码即可在终端直接调用 OpenAI 最新模型与多模态能力，支持 Homebrew 或 Go 安装。

值得关注： 这是 OpenAI 首次推出官方 CLI 工具，降低了开发者体验和 AI 工具链的集成门槛。在 AI Agent 开发领域（如 Claude Code、OpenClaw 等均以终端为核心交互界面），官方 CLI 的推出意味着 OpenAI 正在积极拥抱开发者生态，直接参与"终端优先"的 AI 工具链竞争。

8. 苹果首款 AI 可穿戴设备：带摄像头 AirPods 进入 DVT 阶段

日期： 2026年5月8日（彭博社 Mark Gurman 报道）

事件： 知名爆料人 Mark Gurman 透露，苹果内置摄像头的 AirPods 已进入设计验证（DVT）后期阶段，接近试产，最快 9 月推出。该设备旨在通过内置摄像头增强 AI 感知能力而非拍照，将成为苹果首款真正的 AI 可穿戴设备，为 Siri 提供"视觉"能力。

值得关注： 这是苹果在 AI 硬件领域的重大布局。与纯软件智能体不同，带视觉能力的 AI 耳机将开创"听觉+视觉+空间感知"的全栈 AI 交互范式，直接对标 Google Glass、Ray-Ban Meta 等竞品。9 月发布窗口意味着 AI 可穿戴设备竞争可能在下半年全面爆发。

9. 智谱 GLM-5V-Turbo 向 Coding Plan 用户开放

日期： 2026年5月9日（4月2日发布技术报告，5月9日开放申请）

事件： 智谱 AI 向 GLM Coding Plan 用户开放 GLM-5V-Turbo 多模态编码基座模型的使用申请。该模型从预训练阶段深度融合视觉与文本能力，将"看图"能力原生嵌入编码场景，智能体可通过理解截图、设计稿等视觉输入直接生成代码。

值得关注： 多模态 Coding 是当前智能体开发中最有想象力的方向之一——让 AI 像人类开发者一样"看到"界面设计稿然后写出对应代码，这将大幅降低从需求到实现的信息损耗。智谱选择先面向 Coding Plan 用户开放，也反映了该模型的定位核心是开发者工具链。

10. 商汤科技推出 SenseNova 6.7 Flash-Lite 轻量多模态智能体模型

日期： 2026年5月9日

事件： 商汤科技旗下日日新 SenseNova 平台推出 6.7 Flash-Lite 模型，定位为面向真实工作流的轻量多模态智能体模型。在长链路任务、规划能力与多模态理解上表现突出，适用于需要快速响应和低成本部署的智能体场景。

值得关注： 商汤从 GPU 厂商向大模型厂商转型的战略进一步落地。Flash-Lite 定位"轻量"意味着更低的推理成本和更广泛的部署场景，这对于企业级智能体的大规模部署至关重要。在万亿参数"大模型军备竞赛"中，商汤选择了"轻量高效"的差异化路线。

信息来源：财新网、知乎、新浪财经、中新网、Allan AI、Hugging Face、彭博社、商汤科技、AITop100 等