AI 五一速览:GPT-5.5 登场,蚂蚁开源万亿模型,Google 云破 200 亿-夜雨聆风

AI 五一速览:GPT-5.5 登场,蚂蚁开源万亿模型,Google 云破 200 亿

2026年5月1日

五一节快乐！AI 世界并未休息，过去 24 小时国内外多个重量级动态密集落地：从桌面智能体到万亿参数开源模型，从浏览器原生 AI 到云端营收新高，这份速览帮你快速catch up。

国内产业动态

快手推出 KroWork 桌面 AI 智能体

快手正式推出面向非技术用户的桌面 AI 智能体 KroWork，支持自然语言指令自动完成办公任务，包括文件处理、浏览器自动化和自定义应用生成。其核心逻辑是将日常重复工作流固化为可复用的本地桌面应用——用户只需描述需求，KroWork 自动规划执行步骤并生成结果，后续复用只需点击”运行”按钮，无需重复付费或消耗 Token。

与多数 AI 产品提供一次性对话服务不同，KroWork 将工作流固化为持久本地应用资产，所有操作在隔离沙箱环境中运行，用户数据不上传云端。该产品定位”非技术用户创建自定义桌面工具”的空白市场，集成多个国内外顶尖 AI 模型，覆盖从报告撰写、数据分析到日常办公场景。

蚂蚁集团开源 Ling-2.6-1T 万亿参数模型

蚂蚁集团百灵大模型团队正式开源 Ling-2.6-1T 万亿参数旗舰模型，采用混合架构配合强化奖励策略，实现”快思考”机制——在保持万亿参数智能能力的同时，以更低成本直接输出高质量结果，大幅提升智能效率。该模型在代码生成、缺陷修复和抗噪推理等多项权威执行基准中达到开源顶尖水平。

Ling-2.6-1T 已上线 Hugging Face 和 ModelScope，一周后将在 OpenRouter 平台提供免费 API 调用。蚂蚁集团此次将万亿参数模型竞争从参数规模转向真实任务性能，”快思考”概念被业界视为值得关注的关键趋势。

文心一言 5.1 预览版登陆 LMSYS 竞技场

百度 文心一言 5.1 预览版低调上线国际权威大模型盲测平台 LMSYS Chatbot Arena，总榜排名第 13 位。百度未公开参数规模或架构改进细节，但从竞技场表现推测，该版本在语义理解、多轮对话逻辑和长文本处理稳定性方面有针对性增强。

进入 LMSYS 竞技场被广泛视为模型具备成熟交互能力和全球适用性的信号，表明国内大模型正加速通过国际公开评价体系统验真实能力。文心一言 5.1 正式版的发布，将成为检验其能否在中文语义理解和生产力应用上树立新标杆的关键节点。

全球模型与平台动向

OpenAI 发布 GPT-5.5，Agentic 能力大幅跃升

OpenAI 正式发布 GPT-5.5，为其迄今能力最强的 Agentic AI 模型，在智能体编程、自主计算机操作和科学研究工作流方面实现重大跨越，所需人类引导远低于前代模型。API 定价为前代版本的两倍，API 访问将在完成最终网络安全审查后开放。

此外，OpenAI 还与高通和联发科合作开发 AI 智能体智能手机，目标在 2028 年实现 3 亿至 4 亿部年出货量。该项目标志着 OpenAI 从软件平台向硬件终端延伸的战略布局。

Google Cloud 季度营收首破 200 亿美元

Alphabet 2026 年第一季度财报显示，Google Cloud 营收达 200.3 亿美元，同比增长 63%，首次单季度突破 200 亿美元大关；营业利润近三倍增长至 66 亿美元，云订单储备接近翻倍至 4600 亿美元以上。CEO Sundar Pichai 表示，若非算力产能约束，营收还能更高。

Google 同日宣布向 Anthropic 承诺最高 400 亿美元 conditional 投资，对 Anthropic 估值达 3500 亿美元，其中 100 亿美元为前期现金，其余 300 亿美元与绩效里程碑挂钩，并附带 5 GW Google Cloud 算力承诺（5 年内）。

浏览器与开发者工具

Chrome 正式发布 Prompt API，浏览器原生 AI 时代来临

Google Chrome 正式发布 Prompt API，开发者可通过简单 JavaScript 代码在网页中直接调用内置的 Gemini Nano 轻量模型，实现本地 AI 能力，无需外部 API 调用。模型通过 WebAssembly 或 WebGPU 在浏览器本地运行，所有数据保留在用户设备上，支持离线使用。

该 API 目前处于实验阶段，可在 Chrome Canary、Dev 频道或通过启用实验特性标志的 Chrome 137+ 中使用。设备需具备足够内存和 GPU 加速能力。微软 Edge 也在探索类似接口，浏览器原生 AI 正加速成为行业标准。

IBM 发布 Granite 4.1，8B 参数媲美 32B MoE

IBM 发布开源模型 Granite 4.1，80 亿参数模型在性能上媲美 320 亿参数 MoE 模型，是 IBM 开源模型家族战略的重要进展。该发布在 Hacker News 获得 195 点关注和 105 条评论。

同日，AI 优先代码编辑器 Zed 发布 1.0 正式版，内置 AI 集成，在 Hacker News 获得近 2000 点关注和 644 条评论，成为开发者社区热议焦点。

值得关注的其它动态

• 巨日禄接入火山引擎 Seedance 2.0：AI 短剧制作效率提升 10 倍，画面可用率从 30% 跃升至 90%，标志 AI 短剧生产从手工作坊迈向标准化工业流程。

• 红果短剧清理超万部低质 AI 剧：9 天下架 3522 部不合规短剧，强化版权保护与价值观审核，AI 短剧行业从”数量优先”转向”质量优先”。

• CVPR 2026 揭示视觉智能范式转向：从追求准确率到”感知-推理-决策”一体化，多项选择评测虚高 20 分，行业推动”可验证开放式问答”新范式。

• Anthropic 筹备 500 亿美元融资：据报道 Anthropic 正筹备约 500 亿美元融资轮，估值达 9000 亿美元，成为 AI 安全赛道最大融资之一。

• 微软 Copilot 付费用户突破 2000 万：Microsoft 报告 Copilot 付费用户超 2000 万，数据显示高活跃使用率，AI 企业应用进入规模化收获期。

• Meta 计划裁员数百名 AI 训练外包员工：Meta 将裁减数百名负责 AI 模型训练外包合同的员工，同时 Meta 与 AWS 签署多年协议部署 Graviton5 ARM CPU 支撑具身智能工作负载。

• OpenAI 解释”地精门事件”：OpenAI 发布技术博客，解释 GPT-5.1 为何发展出对”地精”和”格雷姆林”隐喻的偏好，根源在于”Nerdy”人格训练中的奖励信号意外强化了生物隐喻输出。

写在最后

从快手 KroWork 把 AI 智能体装进桌面，到蚂蚁 Ling-2.6 把万亿参数模型开箱即用，再到 Chrome 把 Gemini Nano 塞进每个浏览器——AI 正在从云端到底层、从对话框到工作流，全方位嵌入我们的数字生活。五一假期，不妨思考一下：你的工作流里，还有哪些重复劳动，等待被智能体接管？

来源：网络整理

如果觉得这篇速览有帮助，欢迎转发分享给更多关注 AI 的朋友 🙏