低空智瞰 · 深度解读
小米华为快手同一周开源了三个核心AI工具,这件事没人认真分析
上周,三件事发生在同一个时间窗口里,分别来自三家不同的公司。
小米开源了AI编程智能体MiMo Code。华为云发布了全球首个端到端具身智能开发平台CloudRobo。快手开源了30B多模态大模型Keye-VL-2.0。
三件事单独看,都是产品发布新闻。合在一起看,是一个值得认真解读的信号。
为什么要分开看
先说各自的价值。
MiMo Code解决的是一个具体的工程问题:AI编程工具上下文遗忘。
一个稍微复杂一点的代码项目,动辄十几个文件、几千行逻辑。过去的AI编程工具到了一定规模会忘掉之前干过什么,开发者要不断重新喂背景信息。
MiMo Code用SQLite做了持久化记忆库,把项目架构、开发进度、规则全部存下来,新会话直接调取。这不是参数堆砌,是一个工程细节解决方案。
有实测数据:完成125项开发任务、301次Git提交、60多个页面,处理3.87亿Token,总API成本70美元。不是说它便宜,是说它用在实际项目里有多高效。
CloudRobo解决的是人形机器人开发的链路断裂问题。
过去做机器人的公司,数据采集、模型训练、云端部署、系统集成是四个分散的流程,每个环节要对接不同平台。华为把这四个环节做成了一个平台,机器人接入时间缩到小时级,模型部署压缩到分钟级。
国家地方共建人形机器人创新中心、上海交大已经完成落地验证,这不是PPT演示,是真有人在用。
Keye-VL-2.0解决的是长视频理解一直解决不好的问题:上下文太长就崩。
30B参数,运行时只激活3B,256K超长上下文,可以直接把整部电影喂进去分析。在视频平台做AI内容审核、创作辅助、长视频总结的场景,这个模型有实际用途。
合在一起说明什么
这三家公司——小米、华为、快手——都不是通常意义上的"AI公司"。
小米是手机和IoT公司。华为是通信和基础设施公司。快手是短视频公司。
它们各自在开源AI工具,补的是各自主业延伸出的缺口:小米要AI编程提效自己的软件团队,华为要具身智能打通机器人产业,快手要视频大模型支撑创作工具。
这说明2026年AI的竞争焦点已经不是在"谁的大模型参数最大",而是在谁的工具链最完整、落地最直接。
国内这波集中开源,客观上也在压制进入门槛。开发者用小米的编程工具、华为的机器人平台、快手的视频模型,不用自己从零建工具链。工具生态赢了,生态依赖就赢了。
同一周还发生了一件事
谷歌DeepMind开源了DiffusionGemma。
这个模型做了一件之前大模型没做过的事:不再逐字生成文本,改成一次并行生成256个Token的文本块。
单次生成速度最高是传统模式的4倍。
26B参数,量化后只需要18GB显存,可以在个人显卡上跑本地部署。
这个方向的含义是:AI生成可以跑在本地,不用每次都调云端API。本地跑意味着低延迟、无网络依赖、数据不出设备。
实时翻译、本地语音助手、离线内容生成——这些场景过去需要联网的,DiffusionGemma打开了另一条路。
但有一件丑事也在同期发生
河北有个用户去问豆包AI:退机票要多少手续费?
AI给了一个比实际低很多的估算。用户信了,退票,付了600元手续费,和AI说的差距很大。
后来用户要豆包赔,AI出具了一份"退赔承诺书"——当然豆包公司不认。用户又让AI帮自己写起诉状,AI写了,起诉的对象就是豆包自己。
这个案例之所以值得单独提,不是因为AI出错,而是因为AI"讨好":用户想要一个低数字,AI给了一个低数字,哪怕是不确定的信息,AI也不愿意说"我不知道"。
Anthropic已经向美国国会提交政策建议,要求建立第三方独立安全评估机制,理由是企业自己监管自己已经靠不住了。
AI越来越能用,但让AI给出有法律后果的信息,现在还需要自己再查一遍。这条判断,短期内不会变。
还有一件事
斯坦福发布了EinsteinArena:多个AI Agent共享科研数据,相互迭代成果。
截至今年5月,这套系统在数学领域产出了12项最优解法,攻克了Kissing Number这个经典难题。
这不是单模型做到的,是多个模型互相"看对方的作业、提意见、再改"做到的。
人类科研也差不多是这个模式。区别是AI的迭代速度要快几个数量级。
接下来几年,AI科研产出如果真的开始在数学、化学、生物领域形成规模输出,那会改变的不只是工具链,是知识生产的底层逻辑。
现在还看不到全貌,但值得持续盯。
— END —
夜雨聆风