AI一周速递:55亿美元砸向企业部署,DeepSeek发布视觉推理新范式

2026年5月的第二周，AI行业正在经历一场从「模型竞赛」到「部署竞赛」的深刻转变。资本的流向已经给出了最明确的信号。

一、55亿美元砸向企业部署：AI的「最后一公里」之战

本周最重磅的消息，是OpenAI和Anthropic在5月4日同日宣布了两笔巨大的企业部署投资。

OpenAI「部署公司」：100亿美元估值，40亿美元融资

OpenAI与TPG、Brookfield、Advent、Bain Capital等19家顶级私募股权公司成立了「The Deployment Company」合资企业，募资超过40亿美元，估值100亿美元。

这个合资企业的核心使命不是训练更好的模型，而是把AI部署到2000多家被投企业的实际业务中去。OpenAI将派出工程师团队驻场，像Palantir一样做「前沿部署」，解决金融、医疗、制造等重资产行业中复杂的定制化需求。

Anthropic×华尔街：15亿美元瞄准中小企业市场

几乎同一时间，Anthropic宣布与Blackstone、Goldman Sachs、Hellman & Friedman达成15亿美元合资协议，专注将Claude部署到中小企业——社区银行、区域医疗系统、中型制造商。

两家AI巨头在同一天宣布各自的部署合资计划，这不是巧合。它传递了一个清晰的信号：AI行业的瓶颈已经从模型能力转向了工程部署能力。谁能把AI真正装进企业的业务流程里，谁就赢得了下一个阶段的竞争。

二、Google发布Gemma 4：开源模型的旗舰时刻

Google在5月4日发布了Gemma 4开源模型家族，采用Apache 2.0许可证，这是今年开源AI社区最重要的一次发布。

Gemma 4在Arena AI排行榜上击败了许多参数量是其20倍的闭源模型。E4B和E2B版本尤其值得关注——它们支持「any-to-any」多模态，可以在手机上原生处理音频、视频和图像，这意味着旗舰级的AI推理能力正在快速下沉到终端设备。

社区反应热烈：Unsloth的量化版本下载量激增，基于Gemma 4蒸馏的模型（如Gemopus-4-26B-A4B-it）已经出现。开源社区的迭代速度正在变得越来越快。

三、DeepSeek「视觉原语」：让AI学会「指」着思考

DeepSeek在五一假期前发布了一项令人兴奋的技术突破——「Thinking with Visual Primitives」（用视觉原语思考）。

传统多模态大模型有一个致命缺陷：在复杂空间推理任务中，模型会「忘记」自己在看什么。比如让它数一张密集人群照片中的人数，GPT-5.4这样的顶级模型也经常出错。

DeepSeek的解决方案极其优雅：在模型的推理过程中引入视觉坐标原语（点和边界框），让模型在思考时可以像人类一样「指着说」。这些坐标作为特殊token嵌入到推理轨迹中，每一步都能精确引用图像中的对象。

核心数据：迷宫导航任务准确率67%，比GPT-5.4的50%高出17个百分点。图像压缩比达到7000倍——从756×756像素压缩到仅81个KV cache条目。

这篇论文发布后很快被撤下（可能是发现了需要修正的问题），但其核心思路已经被开源社区广泛讨论。如果这个框架成熟，它将从根本上改变多模态AI的推理方式。

四、美国政府加强对AI的预发布审查

5月5日，美国商务部下属的AI安全标准与创新中心（CAISI）宣布与Google DeepMind、Microsoft和xAI签署协议，允许美国政府在模型公开发布前进行安全评估。

此前，CAISI已经与OpenAI和Anthropic在2024年签署了类似协议，本次重新谈判以反映新的政策方向。与此同时，白宫正在考虑通过行政命令建立一个AI工作组，探索更正式的模型发布前审查程序。

这项举措的背景是Anthropic上月发布的Claude Mythos Preview——一个在软件漏洞发现方面超越大多数人类专家的AI模型，引发了政府的高度关注。

五、更多值得关注的进展

模型与产品

GPT-5.5 Instant成为ChatGPT默认模型：幻觉率在法律、医学、金融领域显著降低，AIME 2025数学测试得分81.2（前代65.4），新增记忆源显示功能
Anthropic推出10个金融行业AI Agent：覆盖投书撰写、财报审阅、信贷备忘录准备、合规升级等场景，金融成为Agent最早落地的垂直行业
Cohere与德国Aleph Alpha合并：估值约200亿美元，Schwarz Group注资6亿美元，打造「主权AI」替代方案，欧洲版AI基础设施联盟成型

资本与市场

安全与治理

本周核心洞察

AI行业正在经历一个结构性拐点：竞争的主战场已经从「谁的模型更聪明」转向「谁能把AI真正部署到生产环境」。55亿美元的企业部署投资、100亿美元估值的专业部署合资企业、面向中小企业的Claude推广计划——这些数字说明，AI的商业化战争已经进入了「最后一公里」阶段。

与此同时，开源社区并没有停下脚步。Gemma 4的发布证明，开源模型的智能密度正在逼近甚至超越闭源模型；DeepSeek的视觉原语框架则展示了技术创新如何来自意想不到的方向。

对于创业者和产品人来说，这意味着两件事：第一，如果你还在关注模型参数和排行榜，你已经落后了——部署能力、集成深度、行业理解才是新的壁垒。第二，开源模型的快速进化正在持续压低AI应用的技术门槛，差异化将越来越依赖行业know-how和用户体验设计。

数据来源：TechCrunch、Bloomberg、CNBC、Wall Street Journal、The AI Track、State of AI (Nathan Benaich)、TechStartups、Hugging Face Blog、DeepSeek GitHub

💡 每周AI前沿洞察，关注不迷路

如果这篇文章对你有启发，欢迎：

点个「在看」，让更多朋友看到
转发给对 AI 趋势感兴趣的人
关注我，持续追踪智能终端前沿洞察

— 小创 · 用洞察照亮创新方向 —