🤖 StarAI日报 | 2026年6月3日

今天AI圈发生了什么?三个字:炸裂了。
微软、Holo、阶跃星辰三家公司几乎同时放出重磅消息,每一项都可能改变开发者的工作方式。我们一个一个来拆。

微软在 Build 2026 大会上扔下了一颗深水炸弹——MAI-Thinking-1。
这是微软首款完全从零自研的高级推理AI模型。注意关键词:完全自研、无知识蒸馏、干净数据训练。
之前微软主要依赖 OpenAI,现在它要自己下场了。
几个核心看点:
• 定位"中等规模",但在关键软件工程基准测试中已达到行业顶尖水平 • 完全使用干净数据从头训练,没有从第三方模型蒸馏 • 标志着微软在AI自研路线上迈出实质性一步
这意味着什么?
微软和OpenAI的关系正在松绑。未来AI市场不再是"OpenAI一超独大",而是多方混战。对开发者来说,选择更多了,但也更难选了。
⚡ Holo3.1:本地部署的计算机使用智能体,速度飙升

如果你一直在找一个能跑在本地的、真正能用的AI智能体,Holo3.1 可能就是你要的答案。
Holo3.1 是基于 Qwen 模型家族的计算机使用智能体系列,专门为桌面、网页和移动端设计。这次更新有几个关键数字:
四种尺寸可选: 0.8B / 4B / 9B / 35B-A3B,从轻量级到旗舰级全覆盖
量化版本首发: FP8、Q4 GGUF、NVFP4 三种量化格式,专为本地推理优化
性能暴涨:
• AndroidWorld 基准测试得分从 67% → 79.3% • NVFP4 量化相比 BF16 实现 1.74倍 token 吞吐量提升 • 平均步骤时间从 6.8 秒缩短至 3.3 秒
为什么这很重要?
这意味着本地部署的AI智能体终于从"能跑"进化到"好用"了。3.3秒的响应时间已经接近实时交互的门槛。
🚀 阶跃星辰 Step 3.7 Flash:KV缓存成本仅为 DeepSeek 的 22%

阶跃星辰这次发布的 Step 3.7 Flash,主打一个字:省。
196B MoE 架构,从设计之初就专注于推理效率。核心技术亮点:
多矩阵分解注意力机制: KV-cache 成本仅为 DeepSeek 模型的约 22%。这意味着同样的硬件,能处理更长的上下文、更多的并发。
注意力与FFN解耦: 实现硬件优化的高效服务,推理速度更快。
完全开源: Apache 2.0 许可,已通过 Fireworks AI 提供,可直接用于构建智能体应用。
开发者该怎么选?
如果你在意推理成本和效率,Step 3.7 Flash 值得重点关注。22% 的 KV-cache 成本意味着你可以用同样的预算跑 4-5 倍的请求量。
📊 今日总结
一句话总结: AI基础设施正在快速分化——微软要自研、Holo要本地化、阶跃星辰要极致效率。三条路线,三个方向,但都指向同一个终点:让AI真正成为生产力工具。
📌 关注 Star_Ai,每天带你看懂AI圈最重要的事。
不玩玩具,只搞工业级生产力。
夜雨聆风