小米刚开源的 AI 编程助手,我试了一下发现确实能打

昨天半夜刷到小米开源 MiMo Code 的消息，第一反应是——又来一个？

不是我不信小米的技术。是这个赛道太挤了。 Claude Code 刚站稳、 Cursor 在 IDE 里杀疯了、 Codex CLI 带着 GPT-5.5 追得很紧，连 Google 都掏了个 Gemini CLI 。这时候进来，怎么看都是往人堆里挤。

但我还是试了。因为一个细节打动了我——它有一个 /dream 命令，每 7 天自动把记忆合并一次。让 AI 越用越懂你的代码库。

说实话，这个点子有点浪漫。

然后我试了一整个晚上。从配置到跑一个完整项目。结论是：小米这次不是来凑热闹的。

MiMo Code 到底做了什么

先说清楚它是什么。

MiMo Code 是一个运行在终端的 AI 编程助手，基于 OpenCode 二次开发， MIT 协议开源——也就是说，你拿来改、二次分发、甚至商业集成都没问题。

配置非常简单。 Mac 上一条命令装好，终端里输入 mimo 就启动了。

它的核心卖点有三件事：

第一，持久记忆系统。用过 Claude Code 的人都知道，聊多了它就"断片"——忘了你半小时前说的上下文，甚至把一个文件改了又改来回翻车。说实话这问题烦了我大半年了，每次都要重复上下文，仿佛在跟一个金鱼聊天。 MiMo Code 搞了三重保险：项目记忆、会话检查点、任务进度。主 Agent 只负责干活，记录全交给一个独立 Subagent 。窗口快满的时候自动重建一份简报，无缝接力。

实测下来，百轮以上的对话确实没有明显的信息丢失。这点我服。

第二， Harness 系统 + Compose 模式。按 Tab 切到 Compose 模式，给它一个想法——"帮我把这个 Express 项目改成 NestJS"——它会自动走完设计、规划、编码、测试、审查的全流程。实测数据也够硬：在 SWE-Bench Pro V2 上比 Claude Code 高了 5 个百分点， Terminal Bench 2 上高了 5 个点。不是碾压，但在一个刚开源的 0.1.0 版本上跑出这个成绩——说实话，有点离谱。

第三，全汉化 + 语音控制。界面是全中文的，状态看板常驻右侧。语音输入基于 MiMo-V2.5-ASR ，可以口头说"执行""重试""发出去"，不用碰键盘。

Claude Code 为什么依然是天花板

聊完小米，得说回 Claude Code 。

Anthropic 做了两年的 Agent 循环，不是一朝一夕能追平的。 2026 年 Q2 的横评数据很清楚：在代码质量、 Agent 稳定性、上下文管理上， Claude Code + Sonnet 4.6 仍然是综合第一。

具体强在哪？

一是工具调用可靠性。独立测试里四款主流工具横比， Claude Code 的工具调用可靠性排第一， Codex CLI 第二， Cursor 第三， Gemini CLI 第四。这意味着什么？你让它改一个文件，它真的只改那个文件——不会顺手删了你整个目录的 eslint 配置。对，这种事情 Cursor 真的干过，我当时整个人都傻了。

二是"深度思考"能力。 2026 年 6 月的掘金那篇横评里有一句说得特别准——"换了模型， Claude Code 的深度思考能力就没了"。换成 DeepSeek 之后，它依然会用"先分析再执行"的框架，但分析出来的结果明显变浅——只看到表面调用关系，发现不了隐式依赖。这是 Claude 自己的推理模型和 Agent 框架深度绑定的结果，不是换个 API Key 能复制的。

三是 token 效率。 Claude Code 完成同等任务消耗的 token 大约少 5.5 倍。返工率比 Cursor 低约 30%。这不是小差距——对于专业开发者来说，每个月能省下的时间就是几十个小时。

但 Claude Code 也有致命问题。贵。 Opus 4.6 跑一个月，正经用下来 80 到 200 美元打底。而且中文支持真的太拉了。说实话我一直想吐槽——一个卖这么贵的产品，连中文文档都写得像机翻，命令行里的报错信息全是英文。你不是说 AI 要造福全人类吗？全人类不包括中国人是吧？

但更让人不爽的是 Claude Code 对国产模型的态度。你自己模型收费高就算了，用户想接个便宜的第三方模型省点钱，还要被各种限制条款卡着。这格局……嗯，我不想说得太难听。

放在同一张桌上比一比

我把它们在几个关键维度上拉了一张表：

维度	MiMo Code	Claude Code
安装门槛	一条命令，全中文	一条命令，全英文
免费额度	MiMo-V2.5 限时免费	无免费，$20/月起
持久记忆	✅ 三重机制，实测百轮不掉	❌ 默认无，靠模型自觉
代码质量	SWE-Bench 62%, Terminal 73%	SWE-Bench 57%, Terminal 68%
工具调用可靠	新工具，数据不足	行业第一
深度分析	日常够用	复杂项目明显更强
中文支持	全中文汉化	英文为主
回合成本	便宜（约 Claude 1/3 ）	$80-200/月（重度）
模型兼容	DeepSeek 、 Kimi 、 GLM 等	仅 Claude 模型
开源协议	MIT 开源	闭源

表格是冷的，说点真实的。

有个开发者在 V2EX 上吐槽："MiMo 在手机端推理很强，但在云端 API 的格式兼容性上问题太多。"另一个用户在我提到的那篇评测底下留言，说用 Claude Code 跑 MiMo-V2.5-Pro 体验很好——"便宜大碗，速度还贼快，关键现在没啥人用。"

同一款工具，两个完全不同的评价。

真实世界就是这样——没有完美的工具，只有适合你的工具。问题是"适合"需要你自己去试，没有人能替你做这个决定。

可笑的是，很多人连试的这一步都没迈出去，就已经站好队了。

所以到底怎么选

我的判断很直接，分三种情况说：

如果你预算不敏感，主力做后端、复杂重构、大型老项目改造——闭眼选 Claude Code + Sonnet 4.6 。它仍然是架构师级别的工具。 MiMo Code 目前在这个场景里还差一口气。

如果你预算敏感，日常写 CRUD 、前端、个人项目——MiMo Code 是目前性价比最高的选择。限时免费的 MiMo-V2.5 已经够用，而且全中文界面意味着你不需要翻文档就能上手。零学习成本本身就是一种竞争力。

如果你用 Claude Code 但想省钱——把 MiMo-V2.5-Pro 当备选模型塞进 Claude Code 里，是目前很多国内开发者在用的组合。工具调用走 Claude 的框架，模型用小米的，便宜大碗。一个叫 cc-switch 的工具可以让你两套配置随时切换。

写到这里我自己都有点烦了——又一张对比表，又一个工具推荐。说实话，每次写这种对比文我都很矛盾。明明市场上工具越来越多，我的选择困难症却越来越重。以前只需要纠结"用不用 AI 写代码"，现在要纠结"用哪个 AI 写代码"。这本身不就是一种进步带来的荒诞吗？

说回最开始那个打动我的点——/dream 命令。

每 7 天，独立 Agent 会读取历史会话和记忆文件，做合并、去重、验证路径有效性、压缩，然后把分散的记忆收敛成一份紧凑的当前状态，更新全局记忆。

听起来像个很酷的科幻设定——给 AI 一个做梦的机制。

但冷静下来想想：记忆系统这件事， Claude Code 不是做不了，是它没把重心放在这。 Anthropic 的路线是"模型更强就行了"，小米的路线是"把系统工程做到位"——两种哲学，没有谁对谁错。

只是对于全中文、开源、零门槛、内存事的 AI 编程工具来说， MiMo Code 确实选了一条不一样的路。

能不能走通？我也不知道。真的不知道。

因为有一个更扎心的问题摆在眼前——小米会把 MiMo Code 维护多久？回忆一下小米之前做过的开源项目，很多都是刚开始热一阵子，然后就……算了，不提了。

这不公平。我知道。但被各种工具坑过无数次之后，我很难不这么想。

但至少这一刻， 2026 年 6 月 11 日的凌晨，这个赛道终于有了第三个值得认真对待的选择。