刚刚,三大AI巨头同时放出重磅炸弹,开发者工具全面洗牌,你准备好了吗

🤖 StarAI日报 | 2026年6月3日

今天AI圈发生了什么？三个字：炸裂了。

微软、Holo、阶跃星辰三家公司几乎同时放出重磅消息，每一项都可能改变开发者的工作方式。我们一个一个来拆。

微软在 Build 2026 大会上扔下了一颗深水炸弹——MAI-Thinking-1。

这是微软首款完全从零自研的高级推理AI模型。注意关键词：完全自研、无知识蒸馏、干净数据训练。

之前微软主要依赖 OpenAI，现在它要自己下场了。

几个核心看点：

这意味着什么？

微软和OpenAI的关系正在松绑。未来AI市场不再是"OpenAI一超独大"，而是多方混战。对开发者来说，选择更多了，但也更难选了。

⚡ Holo3.1：本地部署的计算机使用智能体，速度飙升

如果你一直在找一个能跑在本地的、真正能用的AI智能体，Holo3.1 可能就是你要的答案。

Holo3.1 是基于 Qwen 模型家族的计算机使用智能体系列，专门为桌面、网页和移动端设计。这次更新有几个关键数字：

四种尺寸可选： 0.8B / 4B / 9B / 35B-A3B，从轻量级到旗舰级全覆盖

量化版本首发： FP8、Q4 GGUF、NVFP4 三种量化格式，专为本地推理优化

性能暴涨：

为什么这很重要？

这意味着本地部署的AI智能体终于从"能跑"进化到"好用"了。3.3秒的响应时间已经接近实时交互的门槛。

阶跃星辰这次发布的 Step 3.7 Flash，主打一个字：省。

196B MoE 架构，从设计之初就专注于推理效率。核心技术亮点：

多矩阵分解注意力机制： KV-cache 成本仅为 DeepSeek 模型的约 22%。这意味着同样的硬件，能处理更长的上下文、更多的并发。

注意力与FFN解耦： 实现硬件优化的高效服务，推理速度更快。

完全开源： Apache 2.0 许可，已通过 Fireworks AI 提供，可直接用于构建智能体应用。

开发者该怎么选？

如果你在意推理成本和效率，Step 3.7 Flash 值得重点关注。22% 的 KV-cache 成本意味着你可以用同样的预算跑 4-5 倍的请求量。

一句话总结： AI基础设施正在快速分化——微软要自研、Holo要本地化、阶跃星辰要极致效率。三条路线，三个方向，但都指向同一个终点：让AI真正成为生产力工具。

📌 关注 Star_Ai，每天带你看懂AI圈最重要的事。
不玩玩具，只搞工业级生产力。