最近OpenClaw这只大龙虾很火,很多人都安装上了,但是对里面的很多名词却不清楚,有时候连钱花到哪都不知道。确实这个东西有点偏技术,看看它官方的文档就知道,全是技术语言。
莫慌!今天我就用最接地气的话,帮你把OpenClaw彻底搞明白。看完你就会明白这些名词都是干啥的。
很多人第一次听到 OpenClaw,以为是一个新的聊天 AI,像 ChatGPT 或者豆包那种,打开就能聊。其实不是。OpenClaw 本身不会说话,也不会思考。说白了,它是一个让 AI 真正能干活的框架,是身体,不是大脑。
1
这里说的大脑,就是模型(Model)。
模型是真正负责理解你说的话、给你回答的那个东西。Claude、GPT-4、DeepSeek、豆包、Kimi,这些都是模型。你花钱买 API,本质上就是在买模型的思考时间。
OpenClaw 不跟任何一个模型绑死。你可以今天用 Claude,明天换 DeepSeek,后天改用豆包,OpenClaw 照样跑。
用一个类比:模型是发动机,OpenClaw 是整辆车。发动机可以换,车的结构不变。你每次开车都要烧油,但烧哪家的油是你自己定的。
这样做有一个实际好处:哪家模型最近出了更便宜的版本,切过去就行,不用换工具。
2
那油钱怎么算?这就是 token 了。
token 是模型读懂你说的话的单位,可以把它理解成一个字或半个单词。大概来说,1 个 token 差不多等于 1 个中文汉字,或者 0.75 个英文单词。你发的每一条消息,AI 回的每一个字,都会被换算成 token 来收费。
有一个细节很多人没注意:你发给 AI 的字和 AI 回给你的字,是分开算钱的,而且 AI 回你的部分通常比你问它的部分贵 2 到 5 倍。
也就是说,AI 说得越多,花钱越多。你让它多解释一点,它就多收一点。
用高端模型的时候差距更夸张。GPT-4o 大概是 GPT-4o-mini 的 15 倍价格,但两个模型回答的都是差不多的问题。你感觉就聊了几句,一个月下来账单一看会吓一跳。原因就在这里:每一句话都在花钱,一天聊几十条,一个月就积起来了。
所以你问钱花哪了,很大一部分就是 token 费用。这个钱不是 OpenClaw 收的,是你用的那个模型的公司按用量收的。
3
聊完钱,说说 OpenClaw 为什么叫 Agent,而不叫聊天机器人。
普通聊天机器人是这样:你问一句,它答一句。你不问,它什么都不做。而且每次新对话,它都不知道你上次聊过什么,完全从头开始。
Agent 不一样。你告诉它一个目标,它自己想步骤,自己去做,做完了告诉你结果。中间出错了,它会自己调整再试,不需要你盯着它。
举个例子:你告诉它,把今天客户发来要求修改的邮件整理一下,重要的帮我加进日历。然后你去睡觉。等你醒来,它已经把邮件读完了,整理好了重点,日历也加好了,还顺带告诉你哪封邮件最要紧。
这件事 ChatGPT 做不到,因为你不问它,它什么都不干。OpenClaw 可以在后台一直跑,不需要你随时守在电脑前。
4
但光会思考会规划还不够。你让它发邮件,它得先会发邮件才行。
这里就是 Skill 的作用。
Skill 就是给 OpenClaw 装的技能插件。每个 Skill 对应一件具体的事情,比如管日历、读邮件、运营小红书、写代码。没有装某个 Skill,AI 就不会做那件事,你让它帮你干,它只能告诉你它没这个能力。
打个比方:你雇了一个很聪明的人,但他没有公司大门的门禁卡,就算再能干也进不了门。装 Skill 就是给他配各种门禁,配了哪张卡,他就能进那扇门干那件事。
这也是为什么两个人用一样的模型,一个 AI 能帮你干一堆事,另一个只会聊聊天。差的就是装了多少 Skill。
社区里有人做好的 Skill 可以直接用,自己有特殊需要也可以自己写一个。
5
说到工具,就要提 MCP 了。
MCP 是 Anthropic(Claude 的开发商)提出的一套规范,全名叫 Model Context Protocol。听起来很绕,但说的其实是一件很实际的事。
在 MCP 出来之前,每个 AI 产品要接入外部工具,比如查天气、翻数据表、调用别的软件,都要专门写一套对接代码。工具换了要重写,AI 换了也要重写,很麻烦,而且各家做出来的互不兼容。
MCP 的做法是:大家都按同一套格式来。工具按这个格式做好,AI 也按这个格式去用,两边只要遵守同一套规矩,就能直接接上。
类比就是 USB 接口。USB 出来之前,鼠标键盘打印机各用各的接口,买个新设备还得配专用线。USB 统一之后,任何设备插进去就能用。MCP 想做的,是 AI 工具这个领域的 USB。
OpenClaw 支持 MCP,意思是,别人做好的工具你可以直接拿来用,不用自己一个个去配。
6
好,大脑有了,技能装好了,工具也接上了。那你发的消息是怎么到它那里的?
这里要说三个词:Channel、Gateway、Session。
Channel 就是你发消息用的那个软件。钉钉、飞书、微信,每一个 App 就是一个 Channel。你在哪个 App 发,AI 就在哪里回你。
Gateway 是收消息的中间站。所有 Channel 发进来的消息,都先汇到 Gateway 这里。Gateway 的工作就是判断:这条消息是谁发的,该转给哪个对话去处理。它不做任何思考,就是负责转发。
Session 是 AI 记住你们聊天内容的单位。每个 Session 就像一个对话档案,保存了你们说过的所有话。好处是:你早上在钉钉问了一件事,晚上打开飞书想继续聊,只要还是同一个 Session,AI 记得之前说的。而且这个档案是保存在文件里的,重启也不会消失。
整个流程串起来就是:你在某个 App 发消息,Gateway 把消息转给你的对话档案,档案带着历史记录交给 AI 处理,AI 想好了用工具干完活,再把结果发回给你的 App。
这套设计的好处是:换个 App 聊天,对话不断;换个模型,技能照用;每个部分出问题不会牵连其他部分。
把这些词放在一起,其实说的就是一件事:一个可以 24 小时帮你干活、记住你说过什么、用你选的模型、连接你常用软件的私人助手。
这跟 ChatGPT 和豆包的区别,不是谁更聪明,是工作方式根本不同。
ChatGPT 和豆包是等你来问才回答,你不开口它什么都不做。你的聊天记录在他们的服务器上,怎么被用你不清楚。豆包手机想往这个方向走,但它是封闭产品,能做什么、不能做什么,字节说了算,你改变不了。
OpenClaw 可以设定任务让它定时主动去做,数据存在你自己的电脑上,代码是公开的,谁都能去查它在干什么。而且它能接入任何模型,包括豆包、DeepSeek、Kimi,用哪个大脑你自己选。
说回那个朋友的问题:用 OpenClaw,钱到底花哪儿了?
OpenClaw 这个软件本身是免费的。真正花钱的地方就两块:一是让它 24 小时跑起来的服务器,大概每月 $10-20 左右;二是每次对话消耗的 token 费用,多数人每月在 $20-50 之间,用的模型越贵、聊的越多,就越贵。
有几个省钱的方法值得知道。大部分日常任务用便宜的小模型,只有真正复杂的事情才调贵的大模型,这一条通常能省掉六七成费用。另外开启缓存功能,类似的请求会打折,也能省不少。两个加起来,实际每月花费通常不多。
说了这么多,其实 OpenClaw 的逻辑就像组装一台电脑。Model 是 CPU,是真正在运算的大脑;token 是电费,用多少算多少;Skill 是装在电脑里的软件,装了才能用;MCP 是那个万能插口,什么外设都能接;Channel 和 Gateway 就是你的显示器和连接线,负责把信息传进传出。
它之所以让你感觉比普通聊天机器人贵一点,是因为你不再只是买了一个聊天窗口,而是在搭一个真正属于自己的、24 小时待命的数字助手。模型随时可以换,数据留在自己手里,这种掌控感才是它真正的价值所在。
聊到这里,那堆名词应该不陌生了。下次群里再有人提起这些,说不定你能反过来给他们讲讲发动机和油钱的故事。
夜雨聆风