昨天半夜刷到小米开源 MiMo Code 的消息,第一反应是——又来一个?
不是我不信小米的技术。是这个赛道太挤了。 Claude Code 刚站稳、 Cursor 在 IDE 里杀疯了、 Codex CLI 带着 GPT-5.5 追得很紧,连 Google 都掏了个 Gemini CLI 。这时候进来,怎么看都是往人堆里挤。
但我还是试了。因为一个细节打动了我——它有一个 /dream 命令,每 7 天自动把记忆合并一次。让 AI 越用越懂你的代码库。
说实话,这个点子有点浪漫。
然后我试了一整个晚上。从配置到跑一个完整项目。结论是:小米这次不是来凑热闹的。
MiMo Code 到底做了什么
先说清楚它是什么。
MiMo Code 是一个运行在终端的 AI 编程助手,基于 OpenCode 二次开发, MIT 协议开源——也就是说,你拿来改、二次分发、甚至商业集成都没问题。
配置非常简单。 Mac 上一条命令装好,终端里输入 mimo 就启动了。
它的核心卖点有三件事:
第一,持久记忆系统。 用过 Claude Code 的人都知道,聊多了它就"断片"——忘了你半小时前说的上下文,甚至把一个文件改了又改来回翻车。说实话这问题烦了我大半年了,每次都要重复上下文,仿佛在跟一个金鱼聊天。 MiMo Code 搞了三重保险:项目记忆、会话检查点、任务进度。主 Agent 只负责干活,记录全交给一个独立 Subagent 。窗口快满的时候自动重建一份简报,无缝接力。
实测下来,百轮以上的对话确实没有明显的信息丢失。这点我服。
第二, Harness 系统 + Compose 模式。 按 Tab 切到 Compose 模式,给它一个想法——"帮我把这个 Express 项目改成 NestJS"——它会自动走完设计、规划、编码、测试、审查的全流程。实测数据也够硬:在 SWE-Bench Pro V2 上比 Claude Code 高了 5 个百分点, Terminal Bench 2 上高了 5 个点。不是碾压,但在一个刚开源的 0.1.0 版本上跑出这个成绩——说实话,有点离谱。
第三,全汉化 + 语音控制。 界面是全中文的,状态看板常驻右侧。语音输入基于 MiMo-V2.5-ASR ,可以口头说"执行""重试""发出去",不用碰键盘。
Claude Code 为什么依然是天花板
聊完小米,得说回 Claude Code 。
Anthropic 做了两年的 Agent 循环,不是一朝一夕能追平的。 2026 年 Q2 的横评数据很清楚:在代码质量、 Agent 稳定性、上下文管理上, Claude Code + Sonnet 4.6 仍然是综合第一。
具体强在哪?
一是工具调用可靠性。独立测试里四款主流工具横比, Claude Code 的工具调用可靠性排第一, Codex CLI 第二, Cursor 第三, Gemini CLI 第四。这意味着什么?你让它改一个文件,它真的只改那个文件——不会顺手删了你整个目录的 eslint 配置。对,这种事情 Cursor 真的干过,我当时整个人都傻了。
二是"深度思考"能力。 2026 年 6 月的掘金那篇横评里有一句说得特别准——"换了模型, Claude Code 的深度思考能力就没了"。换成 DeepSeek 之后,它依然会用"先分析再执行"的框架,但分析出来的结果明显变浅——只看到表面调用关系,发现不了隐式依赖。这是 Claude 自己的推理模型和 Agent 框架深度绑定的结果,不是换个 API Key 能复制的。
三是 token 效率。 Claude Code 完成同等任务消耗的 token 大约少 5.5 倍。返工率比 Cursor 低约 30%。这不是小差距——对于专业开发者来说,每个月能省下的时间就是几十个小时。
但 Claude Code 也有致命问题。贵。 Opus 4.6 跑一个月,正经用下来 80 到 200 美元打底。而且中文支持真的太拉了。说实话我一直想吐槽——一个卖这么贵的产品,连中文文档都写得像机翻,命令行里的报错信息全是英文。你不是说 AI 要造福全人类吗?全人类不包括中国人是吧?
但更让人不爽的是 Claude Code 对国产模型的态度。你自己模型收费高就算了,用户想接个便宜的第三方模型省点钱,还要被各种限制条款卡着。这格局……嗯,我不想说得太难听。
放在同一张桌上比一比
我把它们在几个关键维度上拉了一张表:
表格是冷的,说点真实的。
有个开发者在 V2EX 上吐槽:"MiMo 在手机端推理很强,但在云端 API 的格式兼容性上问题太多。"另一个用户在我提到的那篇评测底下留言,说用 Claude Code 跑 MiMo-V2.5-Pro 体验很好——"便宜大碗,速度还贼快,关键现在没啥人用。"
同一款工具,两个完全不同的评价。
真实世界就是这样——没有完美的工具,只有适合你的工具。问题是"适合"需要你自己去试,没有人能替你做这个决定。
可笑的是,很多人连试的这一步都没迈出去,就已经站好队了。
所以到底怎么选
我的判断很直接,分三种情况说:
如果你预算不敏感,主力做后端、复杂重构、大型老项目改造——闭眼选 Claude Code + Sonnet 4.6 。它仍然是架构师级别的工具。 MiMo Code 目前在这个场景里还差一口气。
如果你预算敏感,日常写 CRUD 、前端、个人项目——MiMo Code 是目前性价比最高的选择。限时免费的 MiMo-V2.5 已经够用,而且全中文界面意味着你不需要翻文档就能上手。零学习成本本身就是一种竞争力。
如果你用 Claude Code 但想省钱——把 MiMo-V2.5-Pro 当备选模型塞进 Claude Code 里,是目前很多国内开发者在用的组合。工具调用走 Claude 的框架,模型用小米的,便宜大碗。一个叫 cc-switch 的工具可以让你两套配置随时切换。
写到这里我自己都有点烦了——又一张对比表,又一个工具推荐。说实话,每次写这种对比文我都很矛盾。明明市场上工具越来越多,我的选择困难症却越来越重。以前只需要纠结"用不用 AI 写代码",现在要纠结"用哪个 AI 写代码"。这本身不就是一种进步带来的荒诞吗?
说回最开始那个打动我的点——/dream 命令。
每 7 天,独立 Agent 会读取历史会话和记忆文件,做合并、去重、验证路径有效性、压缩,然后把分散的记忆收敛成一份紧凑的当前状态,更新全局记忆。
听起来像个很酷的科幻设定——给 AI 一个做梦的机制。
但冷静下来想想:记忆系统这件事, Claude Code 不是做不了,是它没把重心放在这。 Anthropic 的路线是"模型更强就行了",小米的路线是"把系统工程做到位"——两种哲学,没有谁对谁错。
只是对于全中文、开源、零门槛、内存事的 AI 编程工具来说, MiMo Code 确实选了一条不一样的路。
能不能走通?我也不知道。真的不知道。
因为有一个更扎心的问题摆在眼前——小米会把 MiMo Code 维护多久?回忆一下小米之前做过的开源项目,很多都是刚开始热一阵子,然后就……算了,不提了。
这不公平。我知道。但被各种工具坑过无数次之后,我很难不这么想。
但至少这一刻, 2026 年 6 月 11 日的凌晨,这个赛道终于有了第三个值得认真对待的选择。
夜雨聆风