OpenClaw越用越慢?这6个配置改完,响应速度快3倍-夜雨聆风

OpenClaw越用越慢?这6个配置改完,响应速度快3倍

给OpenClaw发了一句话，然后呢？

30秒过去了。1分钟过去了。它终于憋出一句”你好，有什么可以帮你的”。

或者更气人的——明明刚发了一条”帮我把这个文件整理一下”，它好像突然死机了，半天憋不出半个字。你甚至把手机举起来晃了晃，怀疑是不是WiFi断了。

如果你干过这事儿，你的OpenClaw现在就是个”亚健康”状态。

别急着怪电脑不行。OpenClaw这个项目本身没什么大病，通常就是几个小参数没调对。调完之后，从”慢吞吞”到”秒回”，中间只差十分钟。

先别急着修，看看你属于哪种”卡法”

OpenClaw卡顿这事，我摸了一遍，90%的原因跑不出下面这六种。你对号入座就行。

第一种：发第一条消息就开始等

如果你刚装好OpenClaw，说的第一句话就等了半天。

那问题很简单——模型选错了。

很多人装完OpenClaw，配置都是默认的，或者顺手选了个当下最火的模型。DeepSeek R1确实强，Claude Opus 4确实强，但它们的速度本来就慢。

更要命的是——如果你还不小心开着”思考模式”，那就等于让模型一边想问题一边写作文，双线程干活，不慢才怪。

第二种：开始挺快，聊着聊着就卡了

刚创建会话的时候秒回，聊了二十几轮以后越来越慢，最后干脆转圈圈了。

这叫上下文膨胀。

每聊一句，OpenClaw都会把整段历史一起发给模型。聊到三四十轮的时候，历史记录里可能已经塞了上万token。模型拿到消息先不回答，得先把之前的几千字”读”完——它能不慢吗？

第三种：用了工具之后特别卡

你让它读了个文件、搜了个网页，回来之后后面的话就一顿一顿的。

这是工具结果堆积。

每次执行工具，返回的内容会跟着上下文一起传给模型。搜个网页回来，网页全文进去了。读个文件回来，文件内容进去了。几次下来，模型每次推理前都要扛着一座山跑。

第四种：白天卡成狗，晚上飞起来

白天怎么用怎么卡，到了半夜嗖嗖地快。

这不是玄学，是API限流。大模型API提供商都有频率限制。白天大家都在用，你的Key在排队。晚上人少了，自然就快了。

第五种：电脑风扇越转越猛

你什么都没干，电脑风扇一直呼呼转。

这不是OpenClaw的锅，是历史会话堆太多了。跑久了不清理，磁盘和内存一直在涨，迟早影响整机速度。

第六种：技能装了一箩筐

如果你把网上能找到的技能包都装上去了，那响应慢就正常了。

每个技能都要带着自己的说明书进上下文，技能越多，模型每次要读的说明书越长，自然就越慢。

逐一收拾：六个问题，六个解法

对号入座完了？好，一个萝卜一个坑。

① 换个轻快模型，把思考模式关了

这是最快见效的一招，没有之一。

日常聊天别上那些大块头模型，用轻量的就够了：

{ agents: { defaults: { model: { primary: "deepseek/deepseek-v4-flash", fallbacks: [ "kimi/kimi-k2.6", "deepseek/deepseek-chat", ], }, }, },}

qwen-turbo也行，看你自己顺手。

然后——检查一下思考模式是不是开着。

在WebChat聊天界面顶上，有个模型信息栏，点进去把”思考模式”的开关关掉。或者在对话框里打：

/reasoning off

就这么一下，每次回复的时间能省下一半到八成。

实在急的时候，用 /fast聊天框直接敲 /fast 你的问题，OpenClaw会走优先通道，相当于加了个塞。

② 上下文精简——把”越用越慢”的根拔了

OpenClaw自带两个好东西，但默认可能没全开：

第一个：上下文修剪

{ agents: { defaults: { contextPruning: { mode: "cache-ttl", ttl: "5m", }, }, },}

开了之后，之前工具调用留下的大段结果会被自动清理掉，上下文干净很多。

第二个：自动压缩

{ agents: { defaults: { compaction: { keepRecentTokens: 4000, notifyUser: true, maxActiveTranscriptBytes: 500000, }, }, },}

会话大到一定程度，OpenClaw会自动把旧对话浓缩成摘要，腾出空间。速度自然回到新会话的水平。

万一聊到一半突然卡了：

直接打一句：

/compact 帮我清理一下，保留最近重要的决定

立马压缩，舒坦。

③ 配个”备胎模型”，别在一棵树上吊死

白天卡、晚上快的问题，靠模型降级解决。

{ agents: { defaults: { model: { primary: "deepseek/deepseek-v4-flash", fallbacks: [ "kimi/kimi-k2.6", "qwen/qwen-turbo", "deepseek/deepseek-chat", ], }, }, },}

主力模型限流或者超时了，OpenClaw会自动切到备用模型。你甚至感觉不到换人了，回复就到了。

如果同一个模型你有好几个API Key，也能让他们轮着用：

export DEEPSEEK_API_KEYS="key1,key2,key3"

④ 别一个会话走到黑

这事儿说出来简单，但好多人就是做不到。

不同的事，开不同的会话。

闲聊 → 开个轻量会话
写代码 → 开一个专门的工作会话
整理文档 → 再开一个

这样每个会话的上下文都不会膨胀太快。而且你可以给不同会话配不同的模型——写代码用强模型，闲聊用快模型。

定期倒垃圾：

openclaw sessions listopenclaw sessions prune

⑤ 少装点技能

打开你的配置，看看是不是挂了一长串技能。

{ agents: { list: [ { id: "main", skills: ["github", "weather", "lark-im"], }, ], },}

只留你日常真的会用的。那些装了但半年没碰过的，先禁了也不碍事，想用的时候再开。

⑥ 如果你的电脑只有8G内存

配置一般的话，别让模型看太多东西：

{ agents: { defaults: { contextLimits: { toolResultMaxChars: 8000, memoryGetMaxChars: 6000, }, startupContext: { dailyMemoryDays: 1, maxFileChars: 800, maxTotalChars: 1500, }, }, },}

相当于告诉模型：”别太贪心，少看几眼就够了。”

对于日常聊天来说，速度会明显上来。

懒人包：直接抄的配置模板

把这段扔进你的 ~/.openclaw/openclaw.json，重启Gateway，收工：

{ agents: { defaults: { model: { primary: "deepseek/deepseek-v4-flash", fallbacks: [ "kimi/kimi-k2.6", "qwen/qwen-turbo", "deepseek/deepseek-chat", ], }, contextPruning: { mode: "cache-ttl", ttl: "5m", }, compaction: { keepRecentTokens: 4000, notifyUser: true, maxActiveTranscriptBytes: 500000, }, contextLimits: { toolResultMaxChars: 8000, memoryGetMaxChars: 6000, }, startupContext: { dailyMemoryDays: 1, maxFileChars: 800, maxTotalChars: 1500, }, skipOptionalBootstrapFiles: ["HEARTBEAT.md"], }, },}

openclaw gateway restart

记一句就够了

选轻模型，关思考。开修剪，配降级。分会话，简技能，限上下文。

按这个顺序摸一遍，十分钟搞定。

如果试了一圈还卡，评论区见，我再帮你查。

P.S. 你要是用的旧版本，先升个级：

npm update -g openclaw 写一篇文章要多久？我用五只虾把时间砍了90% 别只会装别人做的Skill，自己做一个也没多难 OpenClaw vs WorkBuddy: 两个AI Agent，到底谁替你打工？