AI 基础设施和产品层面的竞争正在加速,但真正值得关注的是企业采纳层面的突破。
Claude 发布的 Advisor Strategy 允许将 Opus 作为顾问,Sonnet 或 Haiku 作为执行者,以远低于 Opus 的成本获得接近其水准的推理能力。这种"大模型指导小模型"的思路,本质上是在解决企业 AI 采纳的核心难题:如何在有限的预算下,让团队获得足够强的智能。
更关键的是企业级的组织能力。Claude Cowork 正式对所有付费计划开放,增加了基于角色的访问控制、组支出限制、使用分析和 OpenTelemetry 支持。Monitor Tool 的推出标志着从轮询架构向事件驱动架构的转变——Agent 可以创建后台脚本,在需要时唤醒自己,而不是持续消耗 Token 去检查状态。这种效率提升对于大规模部署至关重要。
另一方面,Anthropic 的 Mythos 模型引发了政府和金融机构的高度关注。财政部和美联储召集华尔街领导人紧急会议,担心该模型的攻击性网络能力带来的风险。Anthropic 已经决定不向公众发布 Mythos,仅通过 Project Glasswing 限制性授权约 40 家公司访问。这种谨慎态度反映了前沿 AI 模型已经触及了真正的安全边界。
Grok-4.20 在 Chatbot Arena 的法律与政府类别排名第一,超越 Anthropic Opus 4.6 和 Google Gemini 3.1 Pro,表明马斯克的模型在特定垂直领域已经达到领先水平。
OpenAI 内部也在经历战略调整。首席科学家 Jakub Pachocki 公开的路线图显示,目标是在 2026 年 9 月实现研究实习生级别的 AI 系统,2028 年 3 月实现完全自动化的 AI 研究员。同时,Stargate 项目的三位高级领导集体离职,创办新公司,OpenAI 正从自建数据中心转向租用大规模计算能力。
一个值得注意的趋势是,硅谷正在悄悄使用中国开源 AI 模型。Cursor 的 Composer 2 构建在 Moonshot 的 Kimi K2.5 上,Cognition 的 SWE-1.6 很可能基于智谱 GLM 进行后训练,Shopify 通过使用中国模型每年节省 500 万美元。这反映了 AI 领域的全球化竞争正在从"谁有更好的模型"转向"谁能以更低的成本部署更智能的应用"。
对企业而言,真正的问题已经不是模型本身,而是如何将 AI 整合到团队的工作流中。从个人试用到团队级采纳,这中间的鸿沟比很多人想象的要大得多。
Claude Code PM 提出的 "Team OS" 概念很有启发性:在 GitHub 上建立共享仓库,将团队的上下文、技能、命令和自动化自动加载到每个会话中。这样,AI 从第一天就开始理解你的产品、流程和标准,而不是每个人从零开始摸索。
这一天最大的启示是,AI 的竞争已经从模型层面的军备竞赛,转向企业采纳和组织能力的较量。谁能真正解决团队级的 AI 采纳难题,谁就能在这场竞争中占据优势。
夜雨聆风