OpenClaw越用越慢?这6个配置改完,响应速度快3倍

30秒过去了。1分钟过去了。它终于憋出一句”你好,有什么可以帮你的”。
或者更气人的——明明刚发了一条”帮我把这个文件整理一下”,它好像突然死机了,半天憋不出半个字。你甚至把手机举起来晃了晃,怀疑是不是WiFi断了。
如果你干过这事儿,你的OpenClaw现在就是个”亚健康”状态。
别急着怪电脑不行。OpenClaw这个项目本身没什么大病,通常就是几个小参数没调对。调完之后,从”慢吞吞”到”秒回”,中间只差十分钟。
先别急着修,看看你属于哪种”卡法”
OpenClaw卡顿这事,我摸了一遍,90%的原因跑不出下面这六种。你对号入座就行。
第一种:发第一条消息就开始等
如果你刚装好OpenClaw,说的第一句话就等了半天。
那问题很简单——模型选错了。
很多人装完OpenClaw,配置都是默认的,或者顺手选了个当下最火的模型。DeepSeek R1确实强,Claude Opus 4确实强,但它们的速度本来就慢。
更要命的是——如果你还不小心开着”思考模式”,那就等于让模型一边想问题一边写作文,双线程干活,不慢才怪。
第二种:开始挺快,聊着聊着就卡了
刚创建会话的时候秒回,聊了二十几轮以后越来越慢,最后干脆转圈圈了。
这叫上下文膨胀。
每聊一句,OpenClaw都会把整段历史一起发给模型。聊到三四十轮的时候,历史记录里可能已经塞了上万token。模型拿到消息先不回答,得先把之前的几千字”读”完——它能不慢吗?
第三种:用了工具之后特别卡
你让它读了个文件、搜了个网页,回来之后后面的话就一顿一顿的。
这是工具结果堆积。
每次执行工具,返回的内容会跟着上下文一起传给模型。搜个网页回来,网页全文进去了。读个文件回来,文件内容进去了。几次下来,模型每次推理前都要扛着一座山跑。
第四种:白天卡成狗,晚上飞起来
白天怎么用怎么卡,到了半夜嗖嗖地快。
这不是玄学,是API限流。大模型API提供商都有频率限制。白天大家都在用,你的Key在排队。晚上人少了,自然就快了。
第五种:电脑风扇越转越猛
你什么都没干,电脑风扇一直呼呼转。
这不是OpenClaw的锅,是历史会话堆太多了。跑久了不清理,磁盘和内存一直在涨,迟早影响整机速度。
第六种:技能装了一箩筐
如果你把网上能找到的技能包都装上去了,那响应慢就正常了。
每个技能都要带着自己的说明书进上下文,技能越多,模型每次要读的说明书越长,自然就越慢。

逐一收拾:六个问题,六个解法
对号入座完了?好,一个萝卜一个坑。
① 换个轻快模型,把思考模式关了
这是最快见效的一招,没有之一。
日常聊天别上那些大块头模型,用轻量的就够了:
{ agents: { defaults: { model: { primary: "deepseek/deepseek-v4-flash", fallbacks: [ "kimi/kimi-k2.6", "deepseek/deepseek-chat", ], }, }, },}qwen-turbo也行,看你自己顺手。
然后——检查一下思考模式是不是开着。
在WebChat聊天界面顶上,有个模型信息栏,点进去把”思考模式”的开关关掉。或者在对话框里打:
/reasoning off就这么一下,每次回复的时间能省下一半到八成。
实在急的时候,用 /fast聊天框直接敲
/fast 你的问题,OpenClaw会走优先通道,相当于加了个塞。
② 上下文精简——把”越用越慢”的根拔了
OpenClaw自带两个好东西,但默认可能没全开:
第一个:上下文修剪
{ agents: { defaults: { contextPruning: { mode: "cache-ttl", ttl: "5m", }, }, },}开了之后,之前工具调用留下的大段结果会被自动清理掉,上下文干净很多。
第二个:自动压缩
{ agents: { defaults: { compaction: { keepRecentTokens: 4000, notifyUser: true, maxActiveTranscriptBytes: 500000, }, }, },}会话大到一定程度,OpenClaw会自动把旧对话浓缩成摘要,腾出空间。速度自然回到新会话的水平。
万一聊到一半突然卡了:
直接打一句:
/compact 帮我清理一下,保留最近重要的决定立马压缩,舒坦。
③ 配个”备胎模型”,别在一棵树上吊死
白天卡、晚上快的问题,靠模型降级解决。
{ agents: { defaults: { model: { primary: "deepseek/deepseek-v4-flash", fallbacks: [ "kimi/kimi-k2.6", "qwen/qwen-turbo", "deepseek/deepseek-chat", ], }, }, },}主力模型限流或者超时了,OpenClaw会自动切到备用模型。你甚至感觉不到换人了,回复就到了。
如果同一个模型你有好几个API Key,也能让他们轮着用:
export DEEPSEEK_API_KEYS="key1,key2,key3"
④ 别一个会话走到黑
这事儿说出来简单,但好多人就是做不到。
不同的事,开不同的会话。
-
闲聊 → 开个轻量会话 -
写代码 → 开一个专门的工作会话 -
整理文档 → 再开一个
这样每个会话的上下文都不会膨胀太快。而且你可以给不同会话配不同的模型——写代码用强模型,闲聊用快模型。
定期倒垃圾:
openclaw sessions listopenclaw sessions prune
⑤ 少装点技能
打开你的配置,看看是不是挂了一长串技能。
{ agents: { list: [ { id: "main", skills: ["github", "weather", "lark-im"], }, ], },}只留你日常真的会用的。那些装了但半年没碰过的,先禁了也不碍事,想用的时候再开。
⑥ 如果你的电脑只有8G内存
配置一般的话,别让模型看太多东西:
{ agents: { defaults: { contextLimits: { toolResultMaxChars: 8000, memoryGetMaxChars: 6000, }, startupContext: { dailyMemoryDays: 1, maxFileChars: 800, maxTotalChars: 1500, }, }, },}相当于告诉模型:”别太贪心,少看几眼就够了。”
对于日常聊天来说,速度会明显上来。
懒人包:直接抄的配置模板
把这段扔进你的
~/.openclaw/openclaw.json,重启Gateway,收工:{ agents: { defaults: { model: { primary: "deepseek/deepseek-v4-flash", fallbacks: [ "kimi/kimi-k2.6", "qwen/qwen-turbo", "deepseek/deepseek-chat", ], }, contextPruning: { mode: "cache-ttl", ttl: "5m", }, compaction: { keepRecentTokens: 4000, notifyUser: true, maxActiveTranscriptBytes: 500000, }, contextLimits: { toolResultMaxChars: 8000, memoryGetMaxChars: 6000, }, startupContext: { dailyMemoryDays: 1, maxFileChars: 800, maxTotalChars: 1500, }, skipOptionalBootstrapFiles: ["HEARTBEAT.md"], }, },}openclaw gateway restart
记一句就够了
选轻模型,关思考。开修剪,配降级。分会话,简技能,限上下文。
按这个顺序摸一遍,十分钟搞定。
如果试了一圈还卡,评论区见,我再帮你查。
P.S. 你要是用的旧版本,先升个级:
npm update -g openclaw写一篇文章要多久?我用五只虾把时间砍了90%别只会装别人做的Skill,自己做一个也没多难OpenClaw vs WorkBuddy: 两个AI Agent,到底谁替你打工?
夜雨聆风

