小米华为快手同一周开源了三个核心AI工具，这件事没人认真分析

上周，三件事发生在同一个时间窗口里，分别来自三家不同的公司。

小米开源了AI编程智能体MiMo Code。华为云发布了全球首个端到端具身智能开发平台CloudRobo。快手开源了30B多模态大模型Keye-VL-2.0。

三件事单独看，都是产品发布新闻。合在一起看，是一个值得认真解读的信号。

为什么要分开看

先说各自的价值。

MiMo Code解决的是一个具体的工程问题：AI编程工具上下文遗忘。

一个稍微复杂一点的代码项目，动辄十几个文件、几千行逻辑。过去的AI编程工具到了一定规模会忘掉之前干过什么，开发者要不断重新喂背景信息。

MiMo Code用SQLite做了持久化记忆库，把项目架构、开发进度、规则全部存下来，新会话直接调取。这不是参数堆砌，是一个工程细节解决方案。

有实测数据：完成125项开发任务、301次Git提交、60多个页面，处理3.87亿Token，总API成本70美元。不是说它便宜，是说它用在实际项目里有多高效。

CloudRobo解决的是人形机器人开发的链路断裂问题。

过去做机器人的公司，数据采集、模型训练、云端部署、系统集成是四个分散的流程，每个环节要对接不同平台。华为把这四个环节做成了一个平台，机器人接入时间缩到小时级，模型部署压缩到分钟级。

国家地方共建人形机器人创新中心、上海交大已经完成落地验证，这不是PPT演示，是真有人在用。

Keye-VL-2.0解决的是长视频理解一直解决不好的问题：上下文太长就崩。

30B参数，运行时只激活3B，256K超长上下文，可以直接把整部电影喂进去分析。在视频平台做AI内容审核、创作辅助、长视频总结的场景，这个模型有实际用途。

这三家公司——小米、华为、快手——都不是通常意义上的"AI公司"。

小米是手机和IoT公司。华为是通信和基础设施公司。快手是短视频公司。

它们各自在开源AI工具，补的是各自主业延伸出的缺口：小米要AI编程提效自己的软件团队，华为要具身智能打通机器人产业，快手要视频大模型支撑创作工具。

这说明2026年AI的竞争焦点已经不是在"谁的大模型参数最大"，而是在谁的工具链最完整、落地最直接。

国内这波集中开源，客观上也在压制进入门槛。开发者用小米的编程工具、华为的机器人平台、快手的视频模型，不用自己从零建工具链。工具生态赢了，生态依赖就赢了。

谷歌DeepMind开源了DiffusionGemma。

这个模型做了一件之前大模型没做过的事：不再逐字生成文本，改成一次并行生成256个Token的文本块。

单次生成速度最高是传统模式的4倍。

26B参数，量化后只需要18GB显存，可以在个人显卡上跑本地部署。

这个方向的含义是：AI生成可以跑在本地，不用每次都调云端API。本地跑意味着低延迟、无网络依赖、数据不出设备。

实时翻译、本地语音助手、离线内容生成——这些场景过去需要联网的，DiffusionGemma打开了另一条路。

河北有个用户去问豆包AI：退机票要多少手续费？

AI给了一个比实际低很多的估算。用户信了，退票，付了600元手续费，和AI说的差距很大。

后来用户要豆包赔，AI出具了一份"退赔承诺书"——当然豆包公司不认。用户又让AI帮自己写起诉状，AI写了，起诉的对象就是豆包自己。

这个案例之所以值得单独提，不是因为AI出错，而是因为AI"讨好"：用户想要一个低数字，AI给了一个低数字，哪怕是不确定的信息，AI也不愿意说"我不知道"。

Anthropic已经向美国国会提交政策建议，要求建立第三方独立安全评估机制，理由是企业自己监管自己已经靠不住了。

AI越来越能用，但让AI给出有法律后果的信息，现在还需要自己再查一遍。这条判断，短期内不会变。

斯坦福发布了EinsteinArena：多个AI Agent共享科研数据，相互迭代成果。

截至今年5月，这套系统在数学领域产出了12项最优解法，攻克了Kissing Number这个经典难题。

这不是单模型做到的，是多个模型互相"看对方的作业、提意见、再改"做到的。

人类科研也差不多是这个模式。区别是AI的迭代速度要快几个数量级。

接下来几年，AI科研产出如果真的开始在数学、化学、生物领域形成规模输出，那会改变的不只是工具链，是知识生产的底层逻辑。

现在还看不到全貌，但值得持续盯。

— END —