乐于分享
好东西不私藏

昨天用OpenClaw干了340次活,账单10.96元:小用量用户选大模型的省钱真相

昨天用OpenClaw干了340次活,账单10.96元:小用量用户选大模型的省钱真相

周一我专门发了一篇关于openclaw使用大模型费用对比的文章,为了进一步搞清楚具体差异,我昨天专门用OpenClaw做了几件事:做了4个PPT(15-18个页面)、升级了20多个技能(clawhub),全程API请求340次,一共消耗了75,299,408个token。猜猜花了多少钱?

10.96元。

用的是DeepSeek-V4-Flash,按量计费。

你可能觉得:一天11块,一个月按20天算也要220块,比阿里云百炼198元/月的Token Plan套餐还贵啊。

别急,我们把这张账单拆开看,里面藏着一个更惊人的事实。

一、340次请求的真实账单

我把昨天的API使用记录翻出来,token消耗分三块:

项目
Token数量
单价(元/百万token)
实际花费
输入(命中缓存)
65,932,800
0.02
1.32元
输入(未命中缓存)
9,085,521
1.0
9.09元
输出
281,087
2.0
0.56元
合计 75,299,408
10.96元

关键数字:缓存命中率87.9%。

什么意思?我反复调用的系统提示、技能框架、常用指令,DeepSeek的缓存机制都记住了,直接以1/50的价格收钱。真正花大钱的“新内容”只占12.1%。

如果这些缓存请求全按正常输入价算,这张账单会是86.55元,而不是10.96元。差距接近8倍。

这才是按量计费碾压套餐的真正原因:高频低量的使用场景,天然享受缓存红利。

套餐可不管你的缓存命中率是多少,Credits消耗一视同仁。你用的重复度越高,按量计费就越划算。

二、百炼Token Plan:198元值不值?

阿里云百炼的旧版Coding Plan已经停售,现在主推Token Plan团队版,最便宜的标准坐席198元/月,给25,000 Credits。

25,000 Credits大概对应3亿token,听起来很多。但同样的消耗量走按量计费,如果缓存命中率和我昨天类似(87%命中的情况下),用DeepSeek-V4-Flash,大概花43.7元。不到198的四分之一。

更关键的是,Credits不能缓存打折。你不管问的是新问题老问题,扣的Credits一样,完全体现不出重复调用的省钱优势。而按量计费,你的固定工作流程越多、用得越熟练,花得越少。

结论很直白:周用两三次或者常规沟通使用的轻度用户,选套餐就是白交月费。只有在每天高强度、且无法享受缓存红利的场景(例如每次都问全新问题),Token Plan才可能划算。

三、当前国内主流大模型最新价格(2026年4月更新)

走按量计费就得知道价格。以下是各平台最新公开定价,单位:元/百万token。

平台
模型
输入价格
输出价格
缓存命中价
亮点
DeepSeek
V4-Flash
1.0
2.0
0.02
缓存红利之王
DeepSeek
V4-Pro
3.0
6.0
0.025
限时2.5折,5月5日截止
DeepSeek
V3.2
0.28
0.42
极低基础价
百度千帆
ERNIE-4.5-Turbo
0.8
3.2
输入价低
火山引擎
豆包-Lite
0.3
0.6
轻量最低价
火山引擎
豆包-Pro
2.0
8.0
新用户送800万token
通义千问
Qwen3.6-Flash
1.2
7.2
免费额度
通义千问
Qwen3.6-Max
2.5
10.0
综合能力强
腾讯混元
Hy3-Preview
1.2
4.0
性价比可选
MiniMax
M2.7
2.1
8.4
百万级上下文
智谱
GLM-5.1
4.0
18.0
编程场景强

按我昨天的账单来对比:用豆包-Lite(0.3+0.6)不计缓存,同样7530万token大概花33.9元;用百度千帆ERNIE-4.5-Turbo(0.8+3.2)大概花120.5元。都没有DeepSeek的缓存机制省钱。

所以我的实际结论是:如果你有重复调用需求,选有极低缓存命中价的模型(目前就是DeepSeek Flash/Pro系列),省钱效果断层领先。如果你每次都是全新任务、毫无重复,那就选基础价最低的ERNIE-4.5-Turbo或豆包-Lite。

四、对OpenClaw用户的实操方案

🥇 方案一:零成本起步(初次注册使用)

先白嫖免费额度,确认需求再花钱。

  • 阿里云百炼:新用户送100万token免费额度。

  • 火山引擎豆包:每月送800万token免费额度。

  • 百度千帆:部分模型体验额度。
    这些足够零成本玩OpenClaw一两个月了。

🥈 方案二:按量计费,享受缓存红利(强烈推荐)

像我这样,用多少花多少。重要技巧:把你的固定工作流沉淀下来。OpenClaw的系统提示、技能模板、常用指令,重复调用越多,缓存命中率越高,价格直接变成1/50。

我昨天340次请求的账单就是最好的证明:强度使用一整天,缓存把成本打到了10.96元。 周用两三天,月花费可能只要一杯奶茶钱。

推荐模型优先级:DeepSeek-V4-Flash(缓存红利)> 豆包-Lite(极低基础价)> ERNIE-4.5-Turbo(低输入价)。

注意:DeepSeek-V4-Pro的2.5折优惠到2026年5月5日结束,需要强推理的趁现在。

🥉 方案三:重度再用套餐

当你每月按量计费稳定超过198元,再考虑Token Plan。前提是你真的用不缓存——每个问题都是全新的问题,那Credits不怕浪费。但对大多数固定工作流用户,这一天可能永远不会来。

五、最后还是要给一波关键避坑提醒

不要被月费锚定。大模型价格还在持续下降,你的使用模式只会越来越固定、缓存命中率只会越来越高,按量计费的成本是下降曲线,而套餐的198元是水平线。两者迟早交叉,你越用,按量越便宜。

多平台配置,防挂。 OpenClaw支持多模型入口,百炼免费额度做备份,DeepSeek做主引擎,百度/豆包做补充,一个挂了秒切。

别在旗舰模型花冤枉钱。 做PPT、写文案、查资料,Flash级性能足够。ERNIE-5.0的价格是ERNIE-4.5-Turbo的7.5倍,日常体验你根本感觉不到差别。

看到那张实打实的账单,我最大的感受是:聪明省钱,不是找最便宜的标价,而是让你的使用习惯值钱。

DeepSeek用0.02元的缓存命中价,把“重复”变成了“省钱”。你越稳定地使用,它就越便宜。这才是按量计费对小用量用户真正的善意。对此,你是啥看法呢?欢迎关注、点赞后多多交流!