★ 设为星标 | 可落地的实战教程,有深度的 AI 思考
如果你装好了 Openclaw 却不知道用来干什么,那么你大概根本就不需要一只龙虾;如果你需要龙虾帮你完成工作但感觉龙虾总是干的不尽人意,那么你大概需要换一个模型了。
Openclaw 本身不内置任何大模型,它只是一个框架,你需要通过 API Key 接入一个大模型作为大脑,龙虾才能为你工作。大模型也有智商高低之分,如果你的龙虾干活不麻利,那就得换个大脑。
六大免费模型
免费模型的好处就是可以让你尽快上手,降低试错成本,熟练使用后再切换到适合自己的付费模型。
大量的免费模型可以去 OpenRouter 寻找,它是一个开源的统一大模型聚合平台。
这里推荐几个比较好用的:
StepFun:Step 3.5 Flash(免费)
阶跃出品,日常任务和简单对话都是可以完成的,网上评价也不错,是一个轻量化的模型,特意针对 agent 做了优化。
Qwen:Qwen3.6 Plus Preview(免费)
阿里出品,主打编程和复杂推理,1M 上下文窗口,在 Preview 期间免费,可以在免费期间好好玩一下,据网友评价有点像 Gemini 3 的感觉。
NVIDIA:Nemotron 3 Super (免费)
英伟达出品,开源,120B 总参数,1M 上下文窗口,针对多智能体协作、高并发企业工作流、多步工具调用、复杂推理做了优化。很多网友评价说不是最聪明的模型,但要比其他模型更快。
Arcee AI: Trinity Large Preview (免费)
Arcee 出品,在创意写作、故事讲述、角色扮演、聊天场景和实时语音助手方面表现很好,比一般的推理模型要强。到 4 月 10 日结束免费。
Z.ai: GLM 4.5 Air (免费)
智普出品,GLM 4.5 的轻量级版本,简单使用没问题,不适合复杂任务。
MiniMax:MiniMax M2.5(免费)
MiniMax 出品,目前在 OpenRouter 提供免费调用版本,可以尝试,在编程、工具调用、搜索、办公等领域虽然达不到宣传的 SOTA 级别,但免费给用还要求啥呢。基本的任务没问题,复杂任务可以尝试。
国产模型
智普 GLM-5.1
与上一代 GLM-5 相比,提升巨大,甚至距全球最强编程模型Claude Opus 4.6,只略低 2.6 分。当然具体表现还是实测为准。有网友测试后评价效果远超预期,但距离 Claude Opus 4.6 仍然有不小的差距,可以作为简单任务平替版,毕竟太便宜了。
目前面向 GLM Coding Plan 所有用户开放,但是由于太火爆,每天 10 点准时售罄,想实测的话还是需要一点手速。
MiniMax 2.7
国产模型都喜欢和 Claude 对比,MiniMax 2.7 也不例外,官方公布的数据中,在 Openclaw 使用场景下,与 Claude Sonnet 4.6 表现非常接近,在 40 个复杂任务中保持着 97%的 Skills 遵循率。
在一些网友的实测中表现并不是很理想,能力边界明显。目前可以选用赠送的免费额度体验效果,也可以买 Coding Plan 套餐使用。
Kimi K2.5
今年一月份发布的,在 Openclaw 使用模型中按照成本功率、速度、价格这三个维度进行排名,Kimi K2.5 排在了第三名,成功率达到了 93.4%。
Qwen3.5-max
这是一个开源多模态模型,支持图片和视频输入,综合能力应该可以可以达到 GPT-5.2 的水平,但并不是很适合作为龙虾的主力模型。
DeepSeek-V3.2
性价比极高的选择,推理和代理能力表现不错,适合日常使用。
海外模型
Claude Opus 4.6
无需多言,目前当之无愧的王,能力顶尖,指哪打哪,一众国产模型发新品就要拉出来对标一下。缺点就是太贵。
Claude Sonnet 4.6 的表现要比Opus 差一些,但是价格更低,速度更快,企业首选。不过个人较少使用,因为价格虽低,也没有低到随便用的程度,疑难杂症还是要丢给 Opus 来解决,而简单任务又有更便宜的模型可以替代。
GPT-5.4
非常好用,针对更多的任务场景进行优化,既使不调用 skill 也可以操作很多工具。个人感觉国内用户应该用这个模型的非常多,因为海鲜市场有非常便宜的 API。
Gemini 3.0 Pro
多模态能力更强,不管是视频还是图片,尤其是 Nano Banana 生图能力强到离谱。附带的各种工具,如 Notebooklm 也非常好用,并且打通了谷歌内部的各个生态。我个人平时网页版使用较多,编程和 Openclaw 基本很少使用。网友评价 Gemini 3.0 Pro 审美不错,前段能力极强。另外 Gemini 2.5 Flash 非常适合用于Openclaw,在之前按照成本功率、速度、价格这三个维度的排名中位居第一。
Grok 4.2
目前发布的 Grok 4.2 是小参数版本,与其他 AI 相比,优势在于与 X平台的独家实时数据集成,可以直接访问 X 上的推文。如果有爬取 X 平台数据的需求,可以用这个。
写在最后
关于模型的选择其实没有标准答案,大家根据自己的实际需求和预算来就行。
如果你只是平时随手处理点简单文档,那几个免费模型完全够用了;如果你的任务涉及复杂的编程或者多步调用,那可能还是得考虑一下 Claude 或者 GPT 这样更成熟的方案,至少主脑和方案设计要用顶级模型,安排好的具体任务让性价比模型去干。
大家没必要一上来就追求最贵的,可以先从免费的开始试。适合自己工作流的模型才是最好的。如果你在配置过程中遇到了什么问题,或者发现哪款模型尤其好用还便宜,欢迎留言一起讨论。

今天的内容就分享到这里
欢迎评论区批评指正
如果对你有用可以随手给我个三连
「赞+转发+在看」
有任何需求在评论区告诉我
下期见!
夜雨聆风